지도 학습 알고리즘별 간단한 사용법 정리

2018. 1. 6. 00:07ML(머신러닝)/BASIC


지도 학습 요약 정리



최근접 이웃 


 작은 데이터 셋의 경우 , 기본 모델로서 좋고 설명하기 쉬움



선형 모델


첫번째로 시도하기 좋은 알고리즘, 대용량 데이터 셋 가능, 고차원 데이터에도 가능




나이브 베이즈


분류만 가능, 선형 모델보다 훨씬 가능 선형모델과 역할 비슷하지만 덜 정확




결정트리


매우 빠름, 데이터 스케일 조정 필요 없음, 시각화하기 좋음




 랜덤포레스트


결정 트리보다 거의 좋은 트리 내보냄 , 매우 안정적이고 강력함

데이터 스케일 조정 필요 없음 , 고차원 희소 데이터에는 부적합




그래디언트 부스팅 결정 트리


랜덤포레스트보다 성능 조금 더 좋음 그러나 학습은 조금 더 느리고 예측은 빠르고 메모리를 조금 사용

매개변수 튜닝 할 것이 랜덤포레스트 보단 많음



서포트 벡터 머신


비슷한 의미의 특성들로 이뤄진  중간 규모 데이터셋에 잘맞음 

데이터 스케일 조정 필요 / 매개변수에 민감




신경망


대용량 데이터 셋에 매우 복잡한 모델 가능 

매개변수 선택과 데이터 스케일에 민감

큰 모델 학습이 오래 걸린다






728x90