기본 콘텐츠로 건너뛰기

SW) 머신러닝과 딥러닝 특론 6주차 (오경선교수님) - 질의 응답

1. 질의 응답

1)

- 판다스할 때 한글 필드명 안 됨

- 필드명 없는 경우 (header는 0이 기본값이며, 없는 경우는 header=none으로 해놓고

  일일이 name=['id','1,'2,',3','4'] 이런 식으로 입력해라.

- 판다스로 라벨없는 데이터를 불러오고 넘파이로 바꿔서 분석한 뒤 라벨붙여 저장 연습


2) 내 질문

K-means (활용) 질문입니다.

fruits.npy 가 없어서 오류가 난다고 떠서

아래 줄을 상단에 추가 하여 파일을 다운로드 하였는데요.

!wget https://bit.ly/fruits_300_data -O fruits.npy

드라이브에 fruits.npy가 있어서 작동이 되긴 했지만

런타임을 초기화하면 이러한 제가 다운로드한 데이터 파일도

함께 초기화되면서  지워지는 것 같습니다.

교수님영상에서는 다운로드 절차 없이 하셨는데 어떻게 하신지 궁금합니다.

!wget https://bit.ly/fruits_300_data -O fruits.npy 있어야 하고
매번 다운로드 실행해야 하는 게 맞고 초기화되는게 맞음.
무료이니까 더 바랄 수 없다.

그리고 새롭게 안 사실은 GPU는 누적 사용시간이 12시간이다.
나는 모르고 GPU로 바꿔놓고 써보고 그랬는데...ㅎㅎㅎ
(유료를 쓸 일은 사실 없을 듯)

3) cluster 갯수 관련
- 팔꿈치 이론도 전체로 돌리지는 않는다.
- 샘플링해서 돌리는데 이 샘플링에도 랜덤샘플링, 일정 비율 샘플링 
  방법은 다양하다.

4) 로지스틱 회귀는 분류에 더 가깝다.

5) 군집 나눈 뒤 특성 생각해보기가 중요하다.
   엑셀의 피벗테이블로도 군집특성 알 수 있다.

6) 이번 과제는 비정형 데이터보다는 정형데이터로 머신러닝 할 것.
    비정형 데이터 딥러닝은 보통일이 아님. (데이터 전처리가)

7) 주제는 학생과 같이 할 수 있는 것도 좋다.
  
8) 카카오 오븐이라는 프로토타입 제작 사이트
   협업은 안되어도 링크 공유 등으로 팀원과 같이 해볼 것.

9) 무임승차 방지 : 각각의 프로세스마다 팀장 정하기 또는 
                        매 주 팀장 정하기
 


 

댓글

Creative Commons License