지도 학습 알고리즘별 간단한 사용법 정리
2018. 1. 6. 00:07ㆍML(머신러닝)/BASIC
“지도 학습 요약 정리”
최근접 이웃
작은 데이터 셋의 경우 , 기본 모델로서 좋고 설명하기 쉬움
선형 모델
첫번째로 시도하기 좋은 알고리즘, 대용량 데이터 셋 가능, 고차원 데이터에도 가능
나이브 베이즈
분류만 가능, 선형 모델보다 훨씬 가능 선형모델과 역할 비슷하지만 덜 정확
결정트리
매우 빠름, 데이터 스케일 조정 필요 없음, 시각화하기 좋음
랜덤포레스트
결정 트리보다 거의 좋은 트리 내보냄 , 매우 안정적이고 강력함
데이터 스케일 조정 필요 없음 , 고차원 희소 데이터에는 부적합
그래디언트 부스팅 결정 트리
랜덤포레스트보다 성능 조금 더 좋음 그러나 학습은 조금 더 느리고 예측은 빠르고 메모리를 조금 사용
매개변수 튜닝 할 것이 랜덤포레스트 보단 많음
서포트 벡터 머신
비슷한 의미의 특성들로 이뤄진 중간 규모 데이터셋에 잘맞음
데이터 스케일 조정 필요 / 매개변수에 민감
신경망
대용량 데이터 셋에 매우 복잡한 모델 가능
매개변수 선택과 데이터 스케일에 민감
큰 모델 학습이 오래 걸린다
728x90
'ML(머신러닝) > BASIC' 카테고리의 다른 글
비지도_PCA, NMF, 매니폴드 학습(T-SNE) (0) | 2018.01.07 |
---|---|
비지도_전처리 스케일 조정 (0) | 2018.01.07 |
지도학습_ 커널 서포트 벡터 머신, 신경망 (0) | 2018.01.06 |
지도학습_k-최근접 이웃 , 선형모델(로지스틱,svm) , 나이브 베이즈 분류기 (0) | 2018.01.03 |
문제와 데이터 이해하기 (0) | 2018.01.03 |