1. 질의 응답
1)
- 판다스할 때 한글 필드명 안 됨
- 필드명 없는 경우 (header는 0이 기본값이며, 없는 경우는 header=none으로 해놓고
일일이 name=['id','1,'2,',3','4'] 이런 식으로 입력해라.
- 판다스로 라벨없는 데이터를 불러오고 넘파이로 바꿔서 분석한 뒤 라벨붙여 저장 연습2) 내 질문
K-means (활용) 질문입니다.
fruits.npy 가 없어서 오류가 난다고 떠서
아래 줄을 상단에 추가 하여 파일을 다운로드 하였는데요.
!wget https://bit.ly/fruits_300_data -O fruits.npy
드라이브에 fruits.npy가 있어서 작동이 되긴 했지만
런타임을 초기화하면 이러한 제가 다운로드한 데이터 파일도
함께 초기화되면서 지워지는 것 같습니다.
교수님영상에서는 다운로드 절차 없이 하셨는데 어떻게 하신지 궁금합니다.
!wget https://bit.ly/fruits_300_data -O fruits.npy 있어야 하고
매번 다운로드 실행해야 하는 게 맞고 초기화되는게 맞음.
무료이니까 더 바랄 수 없다.
그리고 새롭게 안 사실은 GPU는 누적 사용시간이 12시간이다.
나는 모르고 GPU로 바꿔놓고 써보고 그랬는데...ㅎㅎㅎ
(유료를 쓸 일은 사실 없을 듯)
3) cluster 갯수 관련
- 팔꿈치 이론도 전체로 돌리지는 않는다.
- 샘플링해서 돌리는데 이 샘플링에도 랜덤샘플링, 일정 비율 샘플링
방법은 다양하다.
4) 로지스틱 회귀는 분류에 더 가깝다.
5) 군집 나눈 뒤 특성 생각해보기가 중요하다.
엑셀의 피벗테이블로도 군집특성 알 수 있다.
6) 이번 과제는 비정형 데이터보다는 정형데이터로 머신러닝 할 것.
비정형 데이터 딥러닝은 보통일이 아님. (데이터 전처리가)
7) 주제는 학생과 같이 할 수 있는 것도 좋다.
8) 카카오 오븐이라는 프로토타입 제작 사이트
협업은 안되어도 링크 공유 등으로 팀원과 같이 해볼 것.
9) 무임승차 방지 : 각각의 프로세스마다 팀장 정하기 또는
매 주 팀장 정하기
댓글
댓글 쓰기