지도_비지도 요약 및 정리

2018. 1. 9. 13:07ML(머신러닝)/BASIC

728x90


총 요약 및 정리


지도든 비지도든 전처리 분해 방법은 데이터 준비 단계에서 아주 중요한 부분


분해 , 매니폴드 학습, 군집


 주어진 데이터에 대한 이해를 높이기 위한 필수 도구


레이블 정보가 없을 때 데이터를 분석할 수 있는 유일한 방법


지도 학습에서도 데이터 탐색 도구는 특성을 이해하기 위해 중요하다


비지도 학습의 성과 -> 정량화하기 어려움 ->하지만 통찰을 얻을 수 있다.





SCIKIT-LEARN 인터페이스


모든 추정기(알고리즘들) 은 모델을 만뜰때 fit 메서드 제공


fit 메서드는 항상 첫 번째 데이터를 매개변수로 데이터 x 를 필요하다. 하나의 데이터 포인트가 하나의 행이고 


연속된 실수값으로 표현 된 numpy 배열이나 scipy 희소행렬이다.


지도 학습 알고리즘은 회귀 분류에서 필요한 타깃값을 가지는 1차원 y 매개변수 필요


모델 적용하는 법 2가지


1. y 배열과 같은 형태로 새 예측 만들기 위해서 -> predict 


2. 입력데이터 x의 새로운 표현 형태를 얻기 위해서는 transform


 estimator.fit(x_train,[y_train])

 estimator.fit(x_train,[y_train])

 estimator.transform(x_test)

 etimator.predict(x_test)

 전처리

분류

 차원 축소

회귀

특성 추출

군집

특성 선택

 


모든 지도 학습 모델은 모델을 평가하기 위한 score(x_test, y_test) 메서도 제공

728x90