Tensorflow 1.x Tabular Data Neural Network Modeling

2020. 1. 4. 23:29분석 Python/Tensorflow

728x90

도움이 되셨다면 광고 한번만 눌러주세요! 블로그 운영에 큰 힘이 됩니다! : )

tabular data에 tensor flow 적용하기.
코드에서 눈여겨 봐야할 점

  • missing value
    • mean 처리
  • selu activation + alpha dropout
  • boosting algorithm idea 비슷하게 흉내내기(틀린 것을 더 학습시키는 구조)
  • Weighted Cross-Entropy (compute class weight)
  • Weight L2 Regularization
  • category 데이터를 onehot을 하지 않고 label encoding 한 후 embedding 또는 onehot으로 처리함. 

  • label smoothing 적용
alpha = 0.95
y_one_hot = tf.add(alpha* tf.one_hot( tf.cast(y , tf.int32) , depth=target_dim) ,
                   (1-alpha) / target_dim)

check

코드: github

https://github.com/sungreong/TIL/blob/master/FrameWork%20Tensorflow/Tensorflow%20Tabular%20Data%20Network(Embedding).ipynb

 

sungreong/TIL

Today I Learned. Contribute to sungreong/TIL development by creating an account on GitHub.

github.com

 

728x90