Visualization(19)
-
scikit-learn 파이프라인 시각화 기능 사용 및 재사용 (pipeline visualization)
scikit-learn이 0.23이 되면서 가장 와 닿은 것인 pipeline을 시각화해주는 것이었다. 이번 글에서는 파이프라인 시각화하는 것과 실제로 아직 저장하는 것을 제공하지 않지만 재사용할 수 있는 방법에 대해서 고민해봤다. import pandas as pd import numpy as np import seaborn as sns import sklearn from sklearn.model_selection import train_test_split from sklearn.pipeline import make_pipeline from sklearn.preprocessing import OneHotEncoder from sklearn.linear_model import LogisticRegress..
2020.05.15 -
seaborn layout 동적으로 만드는 방법 소개
python에서는 시각화를 할 때 이쁘게 그려주는 seaborn을 많이들 사용한다. seaborn을 사용할 때 subplot을 어떻게 주면 좋을지에 대해서 발견한 코드를 공유한다. import seaborn as sns import pandas as pd titanic = pd.read_csv("./../DATA/train.csv") titanic.head() 아래 코드에서는 컬럼을 몇 열로 할지만 정해주면 동적으로 행을 채워준다. categorical_vars = ['Survived','Pclass','Sex','SibSp','Parch','Cabin','Embarked'] num_plots = len(categorical_vars) total_cols = 3 total_rows = num_plots/..
2020.04.19 -
[ Python ] 유용한 시각화 함수들 모음 (boxplot, scatter plot, plotly.express, etc)
https://towardsdatascience.com/four-useful-functions-for-exploring-data-in-python-33b53288cdd8 Four Useful Functions For Exploring Data in Python Exploring and Visualizing Data in Python towardsdatascience.com 파이썬은 시각화 함수가 seaborn 같은 것이 있지만, R의 ggplot에 비해 먼가 아쉬운 점이 있는 것 같다. 그래서 먼가 유용한 함수들을 따로 만들어 넣고 사용해야 한다. 위의 글에서는 시각화를 하는 데 있어서 유용한 함수들을 몇 개 소개하고 있다. import pandas as pd df = pd.read_csv('./../...
2020.01.14 -
[ Python ] 2개 모델 확률값 사후 해석 시각화 그려보기
2개의 모델에 대해서 행별로 확률 값 시각화해보기 그림의 목적 : 2개의 알고리즘이 각 row별로 어떻게 예측하는 것을 통해 헷갈려하는 행이 얼마나 많은지 한 개의 행에 대해서 2개의 모델이 다르게 예측하는지 확인하기 위해 EX) 한 행에 대해서 catboost 모델은 비 올 확률 0.9 lightgbm 모델은 0.1과 같이 상이하게 예측하는지 확인하기 위해 아래 흰색 박스 부분이 서로 다르게 예측하는 부분 plt.style.use('dark_background') fig , ax = plt.subplots(1 , figsize = (15,15)) classes = ["Not Rain", "Rain"] plt.scatter(lgb_prob , ae_catprob[:,1].ravel() , c = caty..
2020.01.04 -
파이썬에서 R처럼 gather 함수와 자주 쓸 것 같은 시각화 코드
파이썬 시각화 연습 난 처음에 R로 배우다 보니, ggplot으로 많이 시각화를 한다. 거기서는 특히 dplyr에 gather와 혼합을 해서 사용을 하는데, 그것과 비슷한 개념으로 코딩을 하고 싶어서 찾아봤지만, 결론은 굳이 그렇게 할 필요가 없었다 파이썬에서는 좀 더 쉽게 저차원에서 시각화를 하다 보니 좀만 알면 쉽고 이쁘게 할 수가 있었다. 파이썬에서 gather를 하려면 melt를 잘 이용해야 한다! import pandas as pd import numpy as np names = [ 'Wilbur', 'Petunia', 'Gregory' ] a = [ 67, 80, 64 ] b = [ 56, 90, 50 ] df = pd.DataFrame({'names':names,'a':a,'b':b}) ##..
2019.07.06 -
Python Group 별로 Bar Graph 그릴 때,
그룹별로 시각화할 일이 있어서 찾아보는데, R과 같이 제공해주는 것도 있지만, 잘 생각해서 해야 하는 것도 있다 목적은 train과 test 별로 각각의 Category 비율 파악을 하는 것이 목적 f, ax = plt.subplots(3,4 , figsize = (20,20)) axx = ax.flatten() f2, ax2 = plt.subplots(3,4 , figsize = (20,20)) axx3 = ax2.flatten() for axx2 , axx4 , j in zip(axx, axx3, catcols) : #output = data.iloc[index_info[0]].reset_index(drop=True).iloc[idx][j].value_counts() tr = data.iloc[ind..
2019.06.09 -
Confusion matrix 시각화
“How to plot wholesome confusion matrix?” by Deepanshu Jindal 유용한 코드니 참고해서 사용하려고하니, 여러분도 애용하세요! https://link.medium.com/dlmxbyUxFW “How to plot wholesome confusion matrix?” A place where words matter link.medium.com def plot_confusion_matrix(cm, target_names=None, cmap=None, normalize=True, labels=True, title='Confusion matrix'): accuracy = np.trace(cm) / float(np.sum(cm)) misclass = 1 - accurac..
2019.05.14