관심있는 주제/GAN(28)
-
Generation of Synthetic Data with Generative Adversarial Networks - 리뷰 4 [Chapter 5]
Chapter 5 Conclusions and future work https://www.researchgate.net/publication/328134142_Generation_of_Synthetic_Data_with_Generative_Adversar ial_Networks 불러오는 중입니다... 드디어 끝이다~~~ 이 프로젝트의 목표는 미래 제품이 최소의 사용자 상호작용을 필요로 하는 방식으로 통합 데이터 생성기의 개발을 돕는 동시에 실제 데이터 세트의 유사한 패턴과 유사한 통계 분포를 보존하는 품질의 통합 데이터를 생성하는 것이다. 대부분의 기존 툴과 통합 데이터를 생성하기 위한 접근방식은 많은 사용자 상호작용을 요구하거나 단순히 초기 실제 데이터 집합의 패턴을 복제하는 데 초점을 맞추지 않는 경..
2019.06.29 -
A Survey on GANs for Anomaly Detection 리뷰
도움이 되셨다면, 광고 한번만 눌러주세요. 블로그 관리에 큰 힘이 됩니다 ^^ 한번 썼다가 와이파이가 끊겨 다 날아가서... 힘든 마음으로 다시 쓴다..ㅠㅠㅠㅠㅠ Anomaly detection은 몇몇의 연구 분야에서 중요한 문제이다. 눈에 보이지 않는 것을 비정상적인 것으로 감지하고 올바르게 분류하는 것은 수년 동안 여러 가지 다른 방식으로 다루어졌던 도전적인 문제다. GAN과 Adversarial training 과정이 이 Anomaly detection 분야에서 최근 좋은 성과를 내고 있다고 한다. 본 논문에서는 GAN 기반의 이상 징후 탐지 방법을 조사하여 장단점을 강조한다. 여기서 괜찮은 것은 다시 한번 또 리뷰를 해야겠다. 볼 논문은 넘쳐난다... 졸꾸졸꾸.... (파파고와 함께라면....) ..
2019.06.29 -
Generation of Synthetic Data with Generative Adversarial Networks - 리뷰 3 [Chapter 4]
Analysis and results the efficiency, the preservation of the data distribution, the preservation of the correlation patterns, and the generation of quality text 4.1 Overall analysis and results 표 4.1은 세 가지 사례 연구 중 한 가지에 대해 실험에서 생성된 데이터의 양을 나타낸다. 사례 D1 및 D2에 대해 명시된 원래 데이터 크기가 원래 데이터 세트 크기에서 무작위로 샘플링한 후 교육 데이터 세트의 크기라는 점을 지적해야 한다. D3의 경우, 데이터 세트 크기가 상당히 작았기 때문에 모든 데이터가 훈련에 사용되었다. 수집된 전체 지표에서, 생성된 ..
2019.06.28 -
Generation of Synthetic Data with Generative Adversarial Networks - 리뷰 2 [Chapter 3]
Chapter 3 Generation of Synthetic Data with GANs 이 연구에서 가장 기여한 점은 GAN framework를 기반으로 한 포괄적인 데이터 생성 접근의 Design과 Test에 있다고 한다. 3.1 The data generation process 8개 단계로 진행 Input은 생성할 데이터의 셋에 해당하는 2차원 관련 구조의 집합인 반면, Output은 동일한 포맷의 합성 데이터로 채워진 유사한 집합이다. 데이터 types와 schema를 탐지하는 것부터 시작. 데이터 속성들 사이에서 co-relation을 잡을 수 있게 Pattern Analysis를 수행해야 한다. Input Data를 기계 학습 모델과 데이터 생성에 사용되는 통계 기능으로 이해할 수 있도록 fea..
2019.06.26 -
Generation of Synthetic Data with Generative Adversarial Networks - 리뷰 1
2018/10/07 먼가 이미지에서 내가 찾고 있는 것이 나온 것 같아서 한번 파보려고 한다. 페이지는 72... 필요한 것만 볼 예정이니, 한번 보는 것을 추천! Abstract synthetic data 생성의 목적은 real 한 데이터를 제공해주지 못하거나, 제한되게 제공할 경우에 사용한다. 민감한 데이터 일 경우 그것을 함부로 원본을 주기가 어려울 것이다. 전통적인 방법들은 중요한 통계적인 성질을 잘 복제하지 못한다. 성질들이라고 하면은 distribution, the patterns or the correlation between variables, are often omitted 게다가 기존 방법들은 최근에 핫한 딥러닝이나 머신러닝 방법을 사용하지 않고 있다. 그래서 기존은 GAN은 이미지와 ..
2019.06.25 -
The Synthetic data vault - 논문리뷰
2016년 논문이지만, Table data 생성에 대해서 접근한 논문인 것 같아서 읽어보려고 한다! 사실 여기선 SDV에 대해서 설명을 하지만, 크게 관심은 없다. 합성 데이터를 어떻게 평가하는지 왜 그렇게 평가해야 하는지 그런 것에 초점을 맞추려고 한다. # Abstract Synthetic Data Vault라는 것을 제안한다. SDV란 관계형 데이터베이스를 생성하는 모델이다. # Introduction 수많은 이해관계자들과의 대화에서, 우리는 사생활 문제로 인해 데이터를 공유할 수 없는 것이 종종 기업이 외부의 도움을 받는 것을 방해한다는 것을 발견했다. 심지어 기업 내에서도 데이터 접근을 제한하는 요인에 의해 개발 및 시험이 저해될 수 있다. 이 논문 역시 Synthetic data를 생성함으로써..
2019.06.25 -
[Review] Deep learning method for synthesis of tabular data
Boogie Software라는 곳에서 tabular data를 GAN을 활용해서 만들어서 상업화가 되고 있는 것 같다. 개인적으로 계속해보고 있지만, 굉장히 불안전하다고 생각하는데, 벌써 상업화하고 있어서 참 빠르다고 생각한다. 은행 거래 데이터를 활용해서 하는 것 같다. 여기선 GAN을 활용해서 합성 데이터를 만든다고 한다. 은행 데이터에는 Categorical , Numerical 변수들이 많이 있는데, 이렇게 합성한 데이터를 training을 할 때나 test 할 때 쓴다고 한다. Data synthesis 막상 데이터는 있지만, 흔한 경우 그 데이터는 Privacy와 굉장히 밀접한 데이터 때문에 실제 데이터를 바로 사용하기가 어려운 경험들이 있을 것입니다. 그래서 상업적으로 사용하기 위해 비슷한..
2019.06.25 -
GAIN: Missing Data Imputation using Generative Adversarial Nets - 간단 리뷰
구조 Generator missing 부분을 완전히 채우기 discriminator의 오분류율을 최대화하게 하는 것이 목표. 최대화한다는 것을 적 진짜인지 가짜인지 구별을 못하게 하는 것 0.5로 만드는 것. Discriminator imputed components와 관측된 값 사이에서 분별하기 생성된 것과 기존의 것 사이에서 분류하는 분류 로스를 최소화해야 한다. hint discriminator에게 특정 정보를 좀 더 주는 역할 이것을 통해 generator는 true underlying data 분포에 따라서 생성할 수 있게 하는 길잡이 역할을 하는 듯 Generator missing부분은 Generator에서 가져오겠다는 의미 M은 Masking Matrix Discriminator 하지만 이런..
2019.06.08 -
Deep Compressed Sensing [ 허접 주의 ]
사실 머라고 하는지 잘 모르겠다ㅎㅎ 코드는 공개가 되어있지만, 논문에 나온 mnist로 한 것은 없다보니,,, 일단 딥마인드가 했다길래, 빠르게 보려고 했는데, 딱히 나와는 큰 상관이 없어보여서 일단 왠지 큰 느낌은 실제 데이터를 직접적으로 비교하기보단, 어떤 F라는 연산을 통해 낮은 차원으로 보내서 거기서 비교하는 간접적인 계산으로 한다는 것 같긴한데........흐음 ( 아닐 수도 있고...) 대충 봐도 딱 느낌이 안와서 일단 패스 https://paperswithcode.com/paper/deep-generative-adversarial-networks-for#code https://arxiv.org/abs/1905.06723 제한된 임의 측정을 통해 이미지를 복구하고 자연스러운 이미지의 구조를 개..
2019.05.29 -
[Review] Anomaly Detection with Generative Adversarial Networks for Multivariate Time Series - 1
GAN과 Anomaly Detection에 대해서 찾아보다가 나온 논문인데, 이게 또 이전에 포스팅한거랑 또 연관이 있고 다 꼬리에 꼬리를 무는 것만 내가 찾는 기분...? https://paperswithcode.com/paper/anomaly-detection-with-generative-adversarial https://github.com/LiDan456/GAN-AD Cyber-Physical Systems 는 로봇, 의료기기,등 물리적인 실제의 시스템과 사이버 공간의 소프트웨어 및 주변환경을 실시간으로 통합해주는 시스템이라고 합니다!! 그러한 CPSs 시스템 점점 복잡해지고 있다고 합니다. 그래서 cyper attack을 막는 목적으로 머 sensor같은 것도 장착되어있다 합니다. 하지만 기존의..
2019.05.19 -
[Review] REAL-VALUED (MEDICAL) TIME SERIES GENERATION WITH RECURRENT CONDITIONAL GANS - (1)
2017 12년도에 나온 논문이지만, 이 논문을 이용해서 파생된 논문들이 있고 Time-Series에서 RNN과 GAN을 합쳐서 사용한 것 같아서 일단 보려고 합니다. 개인적으로 여기서 RNN을 어떻게 활용하는지 궁금하더라고요. https://paperswithcode.com/paper/real-valued-medical-time-series-generation https://github.com/ratschlab/RGAN 이 구조에서 파생된 논문 1 https://arxiv.org/pdf/1901.04997.pdf https://github.com/LiDan456/MAD-GANs 이 구조에서 파생된 논문 2 https://paperswithcode.com/paper/anomaly-detection-wit..
2019.05.19 -
Data Synthesis based on Generative Adversarial Networks [2018] 논문 리뷰 - 2
이전에 1편은 여기에 있습니다! https://data-newbie.tistory.com/103?category=686943 Data Synthesis based on Generative Adversarial Networks [2018] 논문 리뷰 - 1 이 논문을 보는 이유 저번에 리뷰를 했던 https://data-newbie.tistory.com/98?category=686943 GAN 논문에서 해당 논문이 Table 데이터에 CNN 적용했다는 글을 보고 읽기 시작했다. 일반적으로 Table 같은 정형. data-newbie.tistory.com 저번 시간을 아주 간단하게 요약하면 다음과 같습니다. tabular data에 CNN을 적용할 수 있는 구조로 형태를 바꿉니다. Generator , Di..
2019.05.16