지도_비지도 요약 및 정리
2018. 1. 9. 13:07ㆍML(머신러닝)/BASIC
총 요약 및 정리
지도든 비지도든 전처리 분해 방법은 데이터 준비 단계에서 아주 중요한 부분
분해 , 매니폴드 학습, 군집
주어진 데이터에 대한 이해를 높이기 위한 필수 도구
레이블 정보가 없을 때 데이터를 분석할 수 있는 유일한 방법
지도 학습에서도 데이터 탐색 도구는 특성을 이해하기 위해 중요하다
비지도 학습의 성과 -> 정량화하기 어려움 ->하지만 통찰을 얻을 수 있다.
SCIKIT-LEARN 인터페이스
모든 추정기(알고리즘들) 은 모델을 만뜰때 fit 메서드 제공
fit 메서드는 항상 첫 번째 데이터를 매개변수로 데이터 x 를 필요하다. 하나의 데이터 포인트가 하나의 행이고
연속된 실수값으로 표현 된 numpy 배열이나 scipy 희소행렬이다.
지도 학습 알고리즘은 회귀 분류에서 필요한 타깃값을 가지는 1차원 y 매개변수 필요
모델 적용하는 법 2가지
1. y 배열과 같은 형태로 새 예측 만들기 위해서 -> predict
2. 입력데이터 x의 새로운 표현 형태를 얻기 위해서는 transform
estimator.fit(x_train,[y_train]) | estimator.fit(x_train,[y_train]) |
estimator.transform(x_test) | etimator.predict(x_test) |
전처리 | 분류 |
차원 축소 | 회귀 |
특성 추출 | 군집 |
특성 선택 |
|
모든 지도 학습 모델은 모델을 평가하기 위한 score(x_test, y_test) 메서도 제공
728x90
'ML(머신러닝) > BASIC' 카테고리의 다른 글
모델평가와 성능평가 _미완성 (0) | 2018.01.15 |
---|---|
데이터 표현과 특성 공학 (0) | 2018.01.11 |
[ Python ]비지도 군집, 병합군집, 덴드로그램, DBSCAN (2) | 2018.01.09 |
비지도_PCA, NMF, 매니폴드 학습(T-SNE) (0) | 2018.01.07 |
비지도_전처리 스케일 조정 (0) | 2018.01.07 |