분류 전체보기(849)
-
Rmarkdown 꾸미기 종합
Author : LeeSungRyeong 0. RMarkDown 0.1 Markdown? 텍스트 기반의 마크업 언어로 2004년 John Gruber에 의해 만들어졌다. 쉽게 쓰고 읽을 수 있으며 HTM로 변환 가능하다는 장점. 데이터 분석 과정에서 데이터에 접근하고 코드를 실행시키며 동시에 레포트를 작성이 가능하다. 0.2 설치 방법 #install.packages("rmarkdown") 1.1 글자크기 조정 2 3 4 5 6 # 1 #1 #============= ## 2 #2 #============= ### 3 #### 4 ##### 5 ###### 6 1.2 인용 표시 인용 표시 #> **인용** 표시 1.3 목록 첫번째 두번째 세번째 #1. 첫번째 #2. 두번째 #3. 세번째 빨강 녹색 파랑 ..
2019.03.21 -
뼈있는 아무말 대잔치
1주전에 읽어서 그런기 기억이 너무 가물가물하지만, 읽었으니 체크하는 개념으로 작성 인생에 사는 데 있어서 멘탈적으로나 실용적으로 많이 도움이 되는 책인 것 같다.기존에 내가 알고 있던 관점보다 더 넓은 관점으로 갈 수 있게 마음가짐을 바꾼 책이다.항상 고영성 작가님과 신영준 박사님의 Youtube 영상을 많이 보면서 멘탈을 다잡고 있다. 분석에서는 Neural Network 발달 전과 발달 후로도 나눌 수 있을 것 같은데,나의 멘탈은 저 두분을 알기 전과 알고 난 후로 나눌 수 있을 만큼 많은 영향을 받고 있다.
2019.03.19 -
파는 것이 인간이다.
피치 : 설득력 있게 요점만 전달하는 능력 * 피치의 개념* 유명 일화 엘리베이터 피치 1. 한 단어 피치한단어를 들었을 때 생각나게 하는 법검색? -> 구글 팁 : 50개 단어에서 시작해서 25개로 줄이고 계속 줄이는 방식2. 질문 피치자기가 그 질문에 대해서 확실하게 답을 알고 있을 떄 효과적이다. 만약 잘 모른다면 치명적으로 돌아온다.3. 운율 피치한국말에도 이렇게 있으려나? Life is mostly strife ( 인생의 대부분은 투쟁이다 )4. 제목 피치* 유용성과 호기심을 줘야하면서 극도로 구체적으로 적어야 한다.5. 트위터피치140자 내로 말하고자 하는 것을 말하기6. 픽사 피치옛날에 __ , 매일 __ , 어느날 __ , 그래서 __, 그래서 __, 마침내 __ 우리가 원하는 결과에 도달..
2019.03.19 -
Tidyverse (ggplot)
Tidyverse (ggplot) 2. Data Visualization2.1 Grammar of Graphic by ggplot2 package developed by Hadley Wickham based on the philosphpy of hierarchical architecture Library Loading library(tidyverse) library(MASS) #library(ggplot2) 2.2 Understanding ggplot2 via iris data 2.2.1 iris data head(iris) ## Sepal.Length Sepal.Width Petal.Length Petal.Width Species ## 1 5.1 3.5 1.4 0.2 setosa ## 2 4.9 3.0..
2019.03.19 -
Tidyverse (dplyr , tidyr)
Tidyverse (dplyr , tidyr) library(tidyverse) 1.1 Data Loading # library("readr") raw # library(tidyr) long_raw wide_raw ![](../img/rstudio-cheatsheet-spread-gather-sep-unite.png ) ## 1.3 Manupulating Data by *dplyr* packge ### 1.3.1 *select()* **Objective** : Reduce dataframe size to only desired variables for current task ![](../img/select.png) `select` Function : select(data, ...) * `data` : d..
2019.03.17 -
Kaggle 데이터를 활용한 DataTable 문서화.
DataTable 다 돌아가지만, Posting 하기 위해서는 주석으로 올려야해서 주석으로 올립니다. html이나 rmd가 필요하다면 댓글에 글 남겨주세요. library(data.table) Data Loading ![](./../img/dt/dt_reorder.PNG) ```r mydata01 = Data setorder(Data , Subscribers ) head(mydata01) ``` ``` ## Rank Grade Channel name Video Uploads Subscribers ## 1: 4,097th B+ Xiaomi France 17 301 ## 2: 93rd A hairong zheng 492 394 ## 3: 3,517th B+ Jianpeng Li 232 437 ## 4: 3,..
2019.03.17 -
The relativistic discriminator: a key element missing from standard GAN Review
https://arxiv.org/abs/1807.00734 나오게 된 배경 일반적인 GAN에서 Discriminator가 Gradient 가 소실되는 현상이 종종 일어나서 학습이 안되는 경우가 있음. 그리고 이러한 GAN을 향상시키기위해 LSGAN, Wasserstein Distance 와 Gradient Penalty를 사용한 WGAN-GP가 나왔고 이러한 GAN들은 Integral probability Metrics를 기반으로한 논문들이 많이 나오게 됨. IPM을 기반으로 한 GAN들은 Fake 와 Real을 완벽하게 구분하는 것을 방지함으로써, 학습을 계속했을 때 Gradient가 사라지는 현상 없이 학습을 시킬 수 있음. Integral Probability Metric(IPM) IPM 이란 각 ..
2019.03.16 -
Markov Chain Monte Carlo Simulation
Markov Chain Monte Carlo Simulation LeeSungRyeong Bernoulli likelihood와 beta prior를 이용한 성공의 확률 theta의 사후분포 \[Beta(x+\alpha,N-x+\beta)\]에서 자료를 생성하여 히스토그림을 그려보자. 단, \(\alpha= \beta=5\)이고, \(N=10, x=8\)이다. 사후분포가 \(Beta(13,7)\)이므로 Beta 분포에서 자료를 50000개 생성하여 히스토그램을 그리면 다음과 같다. B.10000 = rbeta(10000,13,7) hist(B.10000,freq=F,breaks=100,xlim=c(0,1),ylim=c(0,5)) x=seq(from=0,to=1,by=0.01) lines(x,dbeta(x..
2019.03.16 -
Kaggle BlackFriday 데이터를 활용한 EDA
LeeSungRyeong 관련 파일 : BlackFriday.csv 필요 패키지 :tidyverse gridExtra Tips 그림 크기 방향 조절 하는 방법 ```{r , fig.align=‘center’ , fig.width= 12 , fig.height= 9} library warning message 안 나오게 하는 방법 ```{r, warning=FALSE , message=FALSE } Library Loadlibrary(tidyverse) library(gridExtra) 0. Data Load BlackFriday Click And Download The Data! 사용할 데이터 : BlackFriday.csvdt % mutate( buy_n = n()) %>% filter( buy_n >..
2019.03.16 -
Rmarkdown 사용 방법
LeeSungRyeong 0.1 Markdown? 텍스트 기반의 마크업 언어로 2004년 John Gruber에 의해 만들어졌다. 쉽게 쓰고 읽을 수 있으며 HTM로 변환 가능하다는 장점. 데이터 분석 과정에서 데이터에 접근하고 코드를 실행시키며 동시에 레포트를 작성이 가능하다. 0.2 설치 방법# install.packages("rmarkdown") 1.1 글자크기 조정 2 3 4 5 6# 1 #1 #============= ## 2 #2 #============= ### 3 #### 4 ##### 5 ###### 6 1.2 인용 표시 인용 표시# > **인용** 표시 1.3 목록 첫번째 두번째 세번째#1. 첫번째 #2. 두번째 #3. 세번째 빨강 녹색 파랑#* 빨강 # * 녹색 # * 파랑 1.4 L..
2019.03.16 -
[ R ] AUCROC and KS (H2O)
html이나 rmd가 필요하다면 댓글에 글 남겨주세요. Library Load library(dplyr) library(tidyverse) library(h2o) library(caret) library(riskr) How to install riskr Click Url library(devtools) install_local("C:/Users/lee/Desktop/riskr-master.zip") KS PLOT Func ks_plot % filter( left == 0 ) left1 % dplyr::select( left , p1 ) %>% filter( left == 1 ) cdf1
2019.03.16 -
Kaggle 올림픽 데이터를 활용한 EDA 2번째
Test5 html이나 rmd가 필요하다면 댓글에 글 남겨주세요. 관련 파일 : athlete_events.csv, noc_regions.csv 필요 패키지 :tidyverse Library Load library(tidyverse) 0. Data Load 및 이전 시험 진행과정 Kaggle 120 years of Olympic history: athletes and results에서 압축 파일을 다운 받은 후에 압축을 해제하시오 Kaggle site에 login 후 download 가능. URL : https://www.kaggle.com/heesoo37/120-years-of-olympic-history-athletes-and-results 사용할 데이터 : athlete_events.csv, noc..
2019.03.16