python EDA를 위한 자동 시각화 sweetviz 사용해보기
sweetviz를 통해서 데이터의 상관관계나 분포 그리고 통계치를 보여준다. 비슷한 패키지로는 pandas_profiling이 있다. 안정성면에서는 테스트 결과 pandas_profiling이 더 좋아 보였다. nan이 있으면 아직은 에러가 나는 이유가 있다. 그래도 좋은 점이 2가지 데이터셋을 비교한다던지, 뭔가를 비교한다고 했을 때 굉장히 유용해 보인다. 예를 들어 기존 타깃 0 , 1과 예측 타겟 0 ,1을 비교한다던지 하였을 때 어떻게 구성이 다른 지도 볼 수 있어 보이고 암튼 유용할 것 같아서 공유한다! import pandas as pd import sweetviz as sv df = pd.read_csv("./../../DATA/ENB2012_data.csv") ## 시각화 advert_re..
2020.07.18