분류 전체보기(849)
-
[Python] 실습 Categorical 변수를 Embedding 해보기
https://data-newbie.tistory.com/90?category=749566 NN에서 Categorical Variables에 대해서는 어떻게 해야할까? 현재 Neural Network는 주로 이미지나 비디어 같이 Unconstructed Data에 대해서 Convolution을 사용해서 feature의 Parameter 개수를 축약하면서 Wide한 구조로 만들 수 데이터에 대한 Representation을 layer에.. data-newbie.tistory.com 이번에는 실습을 해보려고 합니다. 이것의 배경에 대해서는 위에 있으니, 참고해주시면 감사하겠습니다. 일단 직관적인 설명은 Categorical를 Embedding을 통해 더 낮은 차원으로 Embedding을 해줍니다. 곧 wor..
2019.05.20 -
[Review] Anomaly Detection with Generative Adversarial Networks for Multivariate Time Series - 1
GAN과 Anomaly Detection에 대해서 찾아보다가 나온 논문인데, 이게 또 이전에 포스팅한거랑 또 연관이 있고 다 꼬리에 꼬리를 무는 것만 내가 찾는 기분...? https://paperswithcode.com/paper/anomaly-detection-with-generative-adversarial https://github.com/LiDan456/GAN-AD Cyber-Physical Systems 는 로봇, 의료기기,등 물리적인 실제의 시스템과 사이버 공간의 소프트웨어 및 주변환경을 실시간으로 통합해주는 시스템이라고 합니다!! 그러한 CPSs 시스템 점점 복잡해지고 있다고 합니다. 그래서 cyper attack을 막는 목적으로 머 sensor같은 것도 장착되어있다 합니다. 하지만 기존의..
2019.05.19 -
[Review] REAL-VALUED (MEDICAL) TIME SERIES GENERATION WITH RECURRENT CONDITIONAL GANS - (1)
2017 12년도에 나온 논문이지만, 이 논문을 이용해서 파생된 논문들이 있고 Time-Series에서 RNN과 GAN을 합쳐서 사용한 것 같아서 일단 보려고 합니다. 개인적으로 여기서 RNN을 어떻게 활용하는지 궁금하더라고요. https://paperswithcode.com/paper/real-valued-medical-time-series-generation https://github.com/ratschlab/RGAN 이 구조에서 파생된 논문 1 https://arxiv.org/pdf/1901.04997.pdf https://github.com/LiDan456/MAD-GANs 이 구조에서 파생된 논문 2 https://paperswithcode.com/paper/anomaly-detection-wit..
2019.05.19 -
Colaboratory와 tensorboard와 tensorflow를 활용한 GAN 구현물
Colab도 있으니 원하시는 분은 댓글 달아주세요 GPU를 제공하는 갓 구글님께서 만들어주신 Colab으로 간단한 Original GAN 구현물입니다. 추가) 학습된 weight를 구글 드라이브에서 가져오는 것도 했습니다! 추가) GPU 설정하는 것도 넣어놨습니다. 추가) Tensorboard도 코드도 넣어놨습니다. 수정이 안되면 복사해서 사용하세요!
2019.05.18 -
Augmentation for small object detection
최근에 OCR을 공부를 해야 해서, 일단 논문은 거의 안 읽고.... 일단 구현하고 Pretrained 하는 데 초점을 맞추고 있는데요. 실제로 타겟이 굉장히 작은 것들이 포함되어있어서 얘네들이 이미 가진 툴에서 너무 작아서 없애버리는 기분을 느껴서 찜찜하고 애네를 어떻게 Augumentation을 해야 하나 찾다고 우연히 이 논문을 발견돼서 읽어보기로 했습니다. 여기서는 MS COCO 데이터를 사용하고 실제로 머 확인을 해보니 작은 Ground-truth 객체와 예측을 한 것에서 threshold가 굉장히 낮다고 합니다. 이 저자들은 2가지로 추측했다고 합니다. 작은 이미지 만이 작은 개체를 포함하고 있으며, 작은 개체가 포함 된 각 이미지 내에서도 충분히 나타나지 않습니다. 그래서 제안한 방법은 다음..
2019.05.18 -
Python에서 RocCurve 시각화하기.
딱히 함수로 지정되어있지 않은 것 같아서 공유합니다. + 저도 나중에 찾아서 보기 편하게 보려고요 ㅎㅎㅎ def rocvis(true , prob , label ) : from sklearn.metrics import roc_curve if type(true[0]) == str : from sklearn.preprocessing import LabelEncoder le = LabelEncoder() true = le.fit_transform(true) else : pass fpr, tpr, thresholds = roc_curve(true, prob) plt.plot(fpr, tpr, marker='.', label = label ) fig , ax = plt.subplots(figsize= (20,10..
2019.05.18 -
머신러닝 모델 학습시키기전에 마인드부터 어떻게 해야할지?
“Train Your Mind Before Training the Machine” by Ravi chandra https://link.medium.com/MpIo3skaMW “Train Your Mind Before Training the Machine” A place where words matter link.medium.com It was all madness of going through ML courses, Google/Youtube, slithering through bulky statistics and math books, biting hard nuts of differential calculus and logarithms, working through Python and code librar..
2019.05.18 -
머신러닝에서 데이터가 부족할 때
“Dealing with the Lack of Data in Machine Learning” by Alexandre Gonfalonieri https://link.medium.com/YW2pTB09LW “Dealing with the Lack of Data in Machine Learning” A place where words matter link.medium.com
2019.05.18 -
어떻게 언제 왜 Normalize Standardize Rescale 해주는지??!
도움이 되셨다면, 광고 한번만 눌러주세요. 블로그 관리에 큰 힘이 됩니다 ^^ 보통 데이터를 분석 시, https://data-newbie.tistory.com/121 Neural Network를 학습하기 전에 Normalize를 왜 해줘야 할까? medium을 보다가 평소에 관심을 가진 주제에 대한 글이 있어서 보기로 하였습니다. 단순 번역일 것 같으니, 원본은 아래에 링크를 남겼습니다! 실제로 기존에 뉴럴 넷을 학습시킬 때는 다 데이터를 normalize를 해.. data-newbie.tistory.com 일단은 Neural Network를 학습을 시 킬 때, 좀 더 학습을 빠르고 안정되게 하기위해서 해주는데요! 이번에는 좀 더 넓은 범위에서 왜 Normalize , Standardize , Resc..
2019.05.18 -
Neural Network를 학습하기 전에 Normalize를 왜 해줘야 할까?
medium을 보다가 평소에 관심을 가진 주제에 대한 글이 있어서 보기로 하였습니다. 단순 번역일 것 같으니, 원본은 아래에 링크를 남겼습니다! 실제로 기존에 뉴럴 넷을 학습시킬 때는 다 데이터를 normalize를 해줍니다. 금액이든 , 나이든 변수 같은 것을 다 0 주변으로 모아준다는 이야기죠 보통 그렇게 하면 장점이 있다고 합니다. 학습이 빨라진다. 수렴을 빨리한다. 참고로 요즘은 sigmoid activation을 NN에서는 거의 안 쓴다고 합니다. 다 알다시피, backpropagation 문제도 있죠? Vanishing gradient 나 exploding gradient 이 글에서는 tanh 와 sigmoid로 비교를 합니다. 결론은 tanh가 좋다는 겁니다. Sigmoid (=logisti..
2019.05.17 -
annotation 2가지 tool 소개
최근에 OCR을 맡게 되어서, 데이터를 생성하기 위해서 annotation 작업을 해야 했습니다. 그래서 몇 가지 알아본 것을 소개하고자 합니다. 저는 처음에 VGG annotator를 사용했는데요. 이것을 제가 쓰지 않은 이유는 html로 사용해야 돼서 삼성 노트북 펜을 쓰지 못해서 안 했습니다. 왜냐면 저는 이것을 버스 타면서 할 거라서요.... 시간을 최대한 효율적으로 쓰기 위해 다른 툴을 찾아 떠났습니다. 그러다가 찾은 것이 labelimg라는 툴이었습니다 이것은 삼성 노트북 펜으로 쭉 그으면 잘 되더라고요!! 그래서 이것을 선정해서 열심히 그리고 있습니다. garbage in garbage out을 막기 위해 열심히 `잘` 그리려고 노력하고 있습니다ㅎㅎㅎㅎ 이상입니다. (tkffuwntpdy b..
2019.05.16 -
[ Python ] xml 파일 형식에서 원하는 부분 빼서 사용해보기
이번에는 xml을 다뤄야 해서, 여기서 원하는 것을 빼는 것을 연습해보겠습니다. 현재 옆에 보시면 annotation 한 것 중에서 저는 object에서 name과 bndbox를 빼고 싶다고 합시다. 그렇다면 어떻게 해야 할까요? 여기서 보시면은 root를 보면 위에서 처럼 annotation이 나옵니다 이제 그다음 그 뿌리를 얻으려면 getchildren을 해야 합니다 해보면 위에 그림과 같이 뿌리를 보여주는 것을 알 수 있습니다. 여기서 보면 알 수 있듯이 결국 어딜 하나를 들어가서 그다음에 뿌리를 보고 또 뿌리를 보고 계속계속 들어가면 되는 구조인 것 같습니다. 그 다음 원하는 것을 얻기 위해 re로 object만 빼냅니다. object_ = [ i for i in child if re.search..
2019.05.16