plotly(6)
-
python) treemap 알아보기
시각화 도구에 대해서 여러 가지 많이 시도해보는 것이 좋을 것 같아 정리를 하나씩 해보고자 한다. 이번 글에서는 시각화 기법중에서 많은 계층 구조 데이터를 표현할 때 적합한 treemap에 대해서 소개하고자 한다. treemap이라는 시각화 기법은 Ben Shneiderman(American computer scientist and professor at the University of Maryland)에 의해서 1990년도에 처음 사용되어졌다 시각화의 공간은 양적 변수에 의해 크기와 순서가 정해지는 사각형으로 분할된다. 트리 맵의 계층에서 수준은 다른 사각형을 포함하는 사각형으로 시각화된다. 계층에서 동일한 수준에 속하는 각 사각형 집합은 데이터 테이블의 표현식 또는 컬럼을 나타난다. 계층에서 동일한 ..
2021.04.29 -
Pandas 에서 Plotly backend 사용하기
import pandas as pd, seaborn as sns import plotly.express as px tips = sns.load_dataset('tips') tips['tip'].plot(kind = 'hist') plotly 4.8 버전부터 된다고 함. pd.options.plotting.backend = "plotly" 이렇게 사용하면 된다! tips[['tip', 'smoker']].plot.box(facet_col = 'smoker') tips.plot.scatter(x = 'tip', y='total_bill') https://plotly.com/python/box-plots/ Box Plots How to make Box Plots in Python with Plotly. plo..
2020.07.02 -
[ Python ] 유용한 시각화 함수들 모음 (boxplot, scatter plot, plotly.express, etc)
https://towardsdatascience.com/four-useful-functions-for-exploring-data-in-python-33b53288cdd8 Four Useful Functions For Exploring Data in Python Exploring and Visualizing Data in Python towardsdatascience.com 파이썬은 시각화 함수가 seaborn 같은 것이 있지만, R의 ggplot에 비해 먼가 아쉬운 점이 있는 것 같다. 그래서 먼가 유용한 함수들을 따로 만들어 넣고 사용해야 한다. 위의 글에서는 시각화를 하는 데 있어서 유용한 함수들을 몇 개 소개하고 있다. import pandas as pd df = pd.read_csv('./../...
2020.01.14 -
[ Python ] plotly express facet_row , col scale free 하는 법 공유
개인적으로 R을 하였을 때 ggplot을 자주 사용하였다. 거기서 facet_row를 통해서 여러 변수를 분리해서 표현하는데, R에서는 scales = free라는 것을 제공해서 아주 예쁘게 그려준다. 그러나 파이썬에서는 이런 시각화를 ggplot만큼 grammar로 편하게 해주는 것을 찾지 못하다가, plotly express가 나올 때 딱 ggplot의 느낌을 받았다. 그래서 몇가지 실험을 해보다가 아쉬운 것을 발견했다. 먼가 변수별로 나눠서 표현하고 싶어서 해보니 다음과 같이 나왔다. import numpy as np d = pd.DataFrame(np.concatenate( (features , np.expand_dims(target, axis = 1)), axis = 1)) d.columns =..
2019.10.18 -
Jupyter에서 Plotly로 Bargraph Button 구현하기
Jupyter에서 widget으로도 그래프에서 버튼 기능이 구현이 되는 것으로 알고 있지만, Plotly를 다른 데에서 버튼 기능을 유지한 채로 적용해야 할 일이 있어서, 구현을 연습해봅니다. widget도 언제 가는 해야겠죠?.... https://lineup.js.org/integrations/jupyter.html http://hselab.org/jupyter-widgets-explore-queueing-models.html 아무튼 지금은 https://data-newbie.tistory.com/106 보여준 Lasso coef 결과물을 Plotting 해보려고 합니다. import plotly.plotly as py import plotly.graph_objs as go from plotly.of..
2019.05.12 -
Lasso coordinate Descent 방식으로 최적의 Coef 구하기
전제를 두고 한다. lambda 는 lassocv를 이용해서 지정한다. tolerance 를 줘서 loop를 빠져나가게 한다. x와 y 는 임의로 줬다고 하자 그다음에 soft-thresholding에 다른 모습을 이용해서 coordinate Descent 하는 것을 보이겠다. 다음 과 같이 정리할 수 있다. 구체적인 식은 나중에 잘 써서 올리겠다. 결국 오른쪽의 하단의 식을 계속 업데이트 해나가면서, 점점 최적화를 진행하면 된다. np.random.seed(19510) reg = LassoCV(cv=5, random_state=0).fit(train_x , train_y ) best_alpha = reg.alpha_ x_corr = pd.DataFrame(train_x).corr().values pri..
2019.05.12