클러스터링 ) 연속형 범주형 변수 둘 다 고려한 알고리즘 살펴보기
installation pip install kmodes Implemented are: k-modes [HUANG97] [HUANG98] k-modes with initialization based on density [CAO09] k-prototypes [HUANG97] 클러스트 $l$ 에서 발생하는 $c_j$ 값이 나오는 확률값을 의미한다. 어떤 클러스트 l에서 $c_j$가 나올 확률이 낮게 나올 수록 loss가 커진다는 의미인 것 같은데, 왜 이게 loss로 가는 지 아직은 잘 이해가 안된다... 추후에 좀 더 알아보도록 하자!! 예제 import numpy as np from sklearn import datasets from kmodes.kprototypes import KPrototypes i..
2021.05.08