scikit-learn 파이프라인 시각화 기능 사용 및 재사용 (pipeline visualization)
·
분석 Python/Scikit Learn (싸이킷런)
scikit-learn이 0.23이 되면서 가장 와 닿은 것인 pipeline을 시각화해주는 것이었다. 이번 글에서는 파이프라인 시각화하는 것과 실제로 아직 저장하는 것을 제공하지 않지만 재사용할 수 있는 방법에 대해서 고민해봤다. import pandas as pd import numpy as np import seaborn as sns import sklearn from sklearn.model_selection import train_test_split from sklearn.pipeline import make_pipeline from sklearn.preprocessing import OneHotEncoder from sklearn.linear_model import LogisticRegress..
seaborn layout 동적으로 만드는 방법 소개
·
분석 Python/Visualization
python에서는 시각화를 할 때 이쁘게 그려주는 seaborn을 많이들 사용한다. seaborn을 사용할 때 subplot을 어떻게 주면 좋을지에 대해서 발견한 코드를 공유한다. import seaborn as sns import pandas as pd titanic = pd.read_csv("./../DATA/train.csv") titanic.head() 아래 코드에서는 컬럼을 몇 열로 할지만 정해주면 동적으로 행을 채워준다. categorical_vars = ['Survived','Pclass','Sex','SibSp','Parch','Cabin','Embarked'] num_plots = len(categorical_vars) total_cols = 3 total_rows = num_plots/..
[ Python ] 유용한 시각화 함수들 모음 (boxplot, scatter plot, plotly.express, etc)
·
분석 Python/Visualization
https://towardsdatascience.com/four-useful-functions-for-exploring-data-in-python-33b53288cdd8 Four Useful Functions For Exploring Data in Python Exploring and Visualizing Data in Python towardsdatascience.com 파이썬은 시각화 함수가 seaborn 같은 것이 있지만, R의 ggplot에 비해 먼가 아쉬운 점이 있는 것 같다. 그래서 먼가 유용한 함수들을 따로 만들어 넣고 사용해야 한다. 위의 글에서는 시각화를 하는 데 있어서 유용한 함수들을 몇 개 소개하고 있다. import pandas as pd df = pd.read_csv('./../...
[ Python ] 2개 모델 확률값 사후 해석 시각화 그려보기
·
분석 Python/Visualization
2개의 모델에 대해서 행별로 확률 값 시각화해보기 그림의 목적 : 2개의 알고리즘이 각 row별로 어떻게 예측하는 것을 통해 헷갈려하는 행이 얼마나 많은지 한 개의 행에 대해서 2개의 모델이 다르게 예측하는지 확인하기 위해 EX) 한 행에 대해서 catboost 모델은 비 올 확률 0.9 lightgbm 모델은 0.1과 같이 상이하게 예측하는지 확인하기 위해 아래 흰색 박스 부분이 서로 다르게 예측하는 부분 plt.style.use('dark_background') fig , ax = plt.subplots(1 , figsize = (15,15)) classes = ["Not Rain", "Rain"] plt.scatter(lgb_prob , ae_catprob[:,1].ravel() , c = caty..
파이썬에서 R처럼 gather 함수와 자주 쓸 것 같은 시각화 코드
·
분석 Python/Visualization
파이썬 시각화 연습 난 처음에 R로 배우다 보니, ggplot으로 많이 시각화를 한다. 거기서는 특히 dplyr에 gather와 혼합을 해서 사용을 하는데, 그것과 비슷한 개념으로 코딩을 하고 싶어서 찾아봤지만, 결론은 굳이 그렇게 할 필요가 없었다 파이썬에서는 좀 더 쉽게 저차원에서 시각화를 하다 보니 좀만 알면 쉽고 이쁘게 할 수가 있었다. 파이썬에서 gather를 하려면 melt를 잘 이용해야 한다! import pandas as pd import numpy as np names = [ 'Wilbur', 'Petunia', 'Gregory' ] a = [ 67, 80, 64 ] b = [ 56, 90, 50 ] df = pd.DataFrame({'names':names,'a':a,'b':b}) ##..
Python Group 별로 Bar Graph 그릴 때,
·
분석 Python/Visualization
그룹별로 시각화할 일이 있어서 찾아보는데, R과 같이 제공해주는 것도 있지만, 잘 생각해서 해야 하는 것도 있다 목적은 train과 test 별로 각각의 Category 비율 파악을 하는 것이 목적 f, ax = plt.subplots(3,4 , figsize = (20,20)) axx = ax.flatten() f2, ax2 = plt.subplots(3,4 , figsize = (20,20)) axx3 = ax2.flatten() for axx2 , axx4 , j in zip(axx, axx3, catcols) : #output = data.iloc[index_info[0]].reset_index(drop=True).iloc[idx][j].value_counts() tr = data.iloc[ind..
Confusion matrix 시각화
·
분석 Python/Visualization
“How to plot wholesome confusion matrix?” by Deepanshu Jindal 유용한 코드니 참고해서 사용하려고하니, 여러분도 애용하세요! https://link.medium.com/dlmxbyUxFW “How to plot wholesome confusion matrix?” A place where words matter link.medium.com def plot_confusion_matrix(cm, target_names=None, cmap=None, normalize=True, labels=True, title='Confusion matrix'): accuracy = np.trace(cm) / float(np.sum(cm)) misclass = 1 - accurac..

AI 도구

AI 도구 사이드 패널

아래 AI 서비스 중 하나를 선택하여 블로그를 보면서 동시에 사용해보세요.

API 키를 입력하세요API 키를 저장하려면 저장 버튼을 클릭하세요API 키가 저장되었습니다
API 키를 입력하세요API 키를 저장하려면 저장 버튼을 클릭하세요API 키가 저장되었습니다
API 키를 입력하세요API 키를 저장하려면 저장 버튼을 클릭하세요API 키가 저장되었습니다
URL과 모델을 입력하세요설정을 저장하려면 저장 버튼을 클릭하세요설정이 저장되었습니다