지도_비지도 요약 및 정리

지도_비지도 요약 및 정리

2018. 1. 9. 13:07ㆍML(머신러닝)/BASIC

총 요약 및 정리

지도든 비지도든 전처리 분해 방법은 데이터 준비 단계에서 아주 중요한 부분

분해 , 매니폴드 학습, 군집

주어진 데이터에 대한 이해를 높이기 위한 필수 도구

레이블 정보가 없을 때 데이터를 분석할 수 있는 유일한 방법

지도 학습에서도 데이터 탐색 도구는 특성을 이해하기 위해 중요하다

비지도 학습의 성과 -> 정량화하기 어려움 ->하지만 통찰을 얻을 수 있다.

SCIKIT-LEARN 인터페이스

모든 추정기(알고리즘들) 은 모델을 만뜰때 fit 메서드 제공

fit 메서드는 항상 첫 번째 데이터를 매개변수로 데이터 x 를 필요하다. 하나의 데이터 포인트가 하나의 행이고

연속된 실수값으로 표현 된 numpy 배열이나 scipy 희소행렬이다.

지도 학습 알고리즘은 회귀 분류에서 필요한 타깃값을 가지는 1차원 y 매개변수 필요

모델 적용하는 법 2가지

1. y 배열과 같은 형태로 새 예측 만들기 위해서 -> predict

2. 입력데이터 x의 새로운 표현 형태를 얻기 위해서는 transform

모든 지도 학습 모델은 모델을 평가하기 위한 score(x_test, y_test) 메서도 제공

모델평가와 성능평가 _미완성 (0)	2018.01.15
데이터 표현과 특성 공학 (0)	2018.01.11
[ Python ]비지도 군집, 병합군집, 덴드로그램, DBSCAN (2)	2018.01.09
비지도_PCA, NMF, 매니폴드 학습(T-SNE) (0)	2018.01.07
비지도_전처리 스케일 조정 (0)	2018.01.07

All I Need Is Data.