관심있는 주제(225)
-
Paper) Deep Neural Decision Forests 정리
기존의 randomforest 같은 경우 데이터의 주요 변동 요인을 포착하는 데 도움이 되는 내부 표현을 효율적으로 학습하는 메커니즘이 부족하다. 본 연구에서는 의사결정 트리의 divide and conquer 원칙을 통해 심층 아키텍처에서 representation learning에서 매력적인 속성을 통합하는 새로운 접근 방식인 Deep Neural Decision Forests을 제시함. 이 논문에서 우리는 (심층) 컨볼루션 네트워크에서 end to end 학습을 위한 대체 분류기로 사용할 수 있는 확률적이고 차별화 가능한 의사 결정 트리를 모델링하고 훈련하는 방법을 보여주었다. 기존의 의사 결정 트리 훈련에 대한 일반적인 접근방식은 일반적으로 탐욕스럽고 국지적인 방식(local manner)으로 작..
2021.12.18 -
TODO) Deepmind) nowcasting 알아보기
우연히 유튜브를 보다가, 날씨 예측 관련해서 딥마인드가 논문을 냈다는 것을 접하게 됐는데, 내용에서 GAN이 나와서 살펴보려고 한다. 아래 동영상도 어렵지 않게 쉽게 잘 설명해주시는 것 같아서 추천한다. https://www.youtube.com/watch?v=rt0fjq7SSE0 Our latest research and state-of-the-art model advances the science of Precipitation Nowcasting, which is the prediction of rain (and other precipitation phenomena) within the next 1-2 hours. In a paper written in collaboration with the Met..
2021.11.15 -
Paper) DATA-DRIVEN OFFLINE OPTIMIZATION FORARCHITECTING HARDWARE ACCELERATORS 리뷰
하드웨어 가속기 디자인에 관련된 논문을 설명하고자 합니다. 목차 Abstract why 디자이너들은 수동적인 노력과 많은 시뮬레이션을 해야 한다. 시뮬레이션 기반의 방식들은 디자인 제한 조건 변화나 target application에 따라서 매번 다르게 다시 해야 한다. 대안적인 방식으로는 data-driven 방식이 있고, 적재된 데이터를 활용하는 방식으로 어떠한 시뮬레이션 형태 없이 아키텍처 할 수 있다. 시뮬레이션 시간을 줄여줄 뿐만 아니라, target application 변화할 때도 재사용할 수 있다. goal 우리의 접근 방식은 원하는 비용 함수의 보수적이고 강력한 추정치를 학습하고 실행 불가능한 점을 활용하며 최적화 중에 추가 시뮬레이터 없이 이 추정치에 대해 설계를 최적화한다. 단일 및 ..
2021.11.06 -
진행중) Reverb: a framework for experience replay 알아보기
경험(experience)의 활용은 강화 학습(RL)에서 중요한 역할을 한다. 이 데이터를 가장 잘 사용하는 방법은 이 필드의 핵심 문제 중 하나입니다. RL 에이전트가 최근 몇 년 동안 발전하면서 더 크고 복잡한 문제(Atari, Go, StarCraft, Dota)를 처리함에 따라 생성된 데이터의 크기와 복잡성이 모두 증가했습니다. 이러한 복잡성에 대처하기 위해 많은 RL 시스템은 학습 문제를 경험 생산자(행위자)와 경험 소비자(학습자)라는 두 개의 뚜렷한 부분으로 분할하여 이러한 서로 다른 부분을 병렬로 실행할 수 있도록 한다. 데이터 스토리지 시스템은 종종 이 두 구성 요소 사이의 교차점에 있습니다. 데이터를 효율적으로 저장하고 전송하는 방법에 대한 문제 자체가 어려운 엔지니어링 문제입니다. 딥마..
2021.10.07 -
Concept drift 설명
목차 Concept drift can appear in different ways Sudden drift 새로운 개념이 단기간에 발생합니다 (예: 2020년 3월 COVID-19 시작, 주가 급변). 전자 상거래, 의료, 금융, 보험 등과 같은 여러 부문에 영향을 미친 COVID-19 전염병과 같은 예기치 않은 상황으로 인해 개념 드리프트가 갑자기 발생하는 경우. 이러한 급격한 변화는 짧게는 몇 주 안에 일어날 수 있습니다. 이러한 종류의 드리프트는 일반적으로 외부 이벤트에 의해 발생합니다. 데이터의 드리프트를 감지하는 활성 모니터링 시스템이 없는 경우 주요 이벤트 후에 개념 드리프트의 존재에 대한 빠른 평가를 수행하는 것이 당연합니다. Gradual drift 새로운 개념이 오랜 기간에 걸쳐 점진적으로..
2021.09.28 -
진행중) Model drift 자료 정리
목차 Definition 모델은 생성된 시간때의 변수와 매개 변수를 기반으로 최적화되기 때문에 이는 기계 학습 모델에 문제를 제기합니다. 기계 학습 모델을 개발하는 동안 이루어진 공통적이고 때로는 부정확한 가정은 각 데이터 지점이 독립적이고 동일한 분포(i.i.d) 랜덤 변수라는 것입니다. 어려운 말로 표현하면, 환경의 변화로 인해 모형의 예측 검정력이 저하되어 변수 간의 관계가 저하되는 것을 말합니다. 위의 예를 참조하면 스팸 전자 메일의 표시 변경으로 인해 몇 년 전에 생성된 부정 탐지 모델이 저하될 수 있습니다. 즉, 시간이 지남에 따라서 기계 학습 모델의 정확도의 상실은 모델 드리프트(model drifit)로 정의됩니다. 크게 2가지 광범위한 범주류 분류할 수 있다고 합니다. Concept Dr..
2021.09.26 -
RL) MARL 자료 모음
MARL을 다시 공부하려고 하니, 어디서부터 시작할지 몰라서 자료 조사부터 시작하였다. 현재 간단하게 Single Agent 방식으로 MARL 적용하는 Naive Learning으로 진행 중인데, 생각보다 성능이 나오지 않고, 원인이 파악이 안되서 미뤄왔던 공부를 다시 해보고자 한다... 아직 필자도 아래 내용을 다 본 게 아니라서, 좋은 링크라고 판단은 할 수 없지만 일단 공부하시는 분들한테 도움이 되었으면 좋겠기에 공유합니다…. Challenge Credit Assignment Problem CONTENT URL 자료시기 분류 MARL PAPER (Papers with code) https://paperswithcode.com/task/multi-agent-reinforcement-learning 계..
2021.09.25 -
Paper) Neural Combinatorial Optimization with Reinforcement Learning - Not Finished...
목차 Abstract goal TSP 문제를 품 우리는 순회 판매원 문제(TSP)에 초점을 맞추고 일련의 도시 좌표가 주어진다면 다른 도시 순열에 대한 분포를 예측하는 반복 신경망을 훈련시킨다. negative tour length를 보상 신호로 사용하여 정책 기울기 방법을 사용하여 현재 신경망의 매개 변수를 최적화한다. 우리는 일련의 훈련에서 네트워크 매개 변수를 학습하는 것과 개별 시험 그래프에서 학습하는 것을 비교한다. 계산 비용에도 불구하고, 많은 엔지니어링 및 휴리스틱 설계 없이, 신경 조합 최적화는 최대 100개의 노드가 있는 2D 유클리드 그래프에서 최적의 결과에 가까운 결과를 달성한다. 또 다른 NP-난이도 문제인 KnapSack에 적용하면, 동일한 방법이 최대 200개의 항목이 있는 인스..
2021.09.14 -
RL) 로봇 개발 플랫폼 Issac 자료 찾아보기
nivida에서 issac gym에 대한 소개가 있어서 자료만 찾아봤다. 결국 말하고자하는 것은 기존 물리환경을 다 gpu에서 돌게 했다는 것이 최근에 강조하는 것 같고, 그래서 자기네 gpu사서 로봇 연구해 약간 이런 느낌으로 들린다. 2017 11 1 https://www.google.com/url?sa=t&source=web&rct=j&url=http://on-demand.gputechconf.com/gtcdc/2017/presentation/dc7125-nvidia-isaac-virtual-environments-for-robot-ai.pdf&ved=2ahUKEwiHntXbzefyAhWSK5QKHZW4CwwQFnoECBYQAQ&usg=AOvVaw1xCtISu5qJhHfN43107m-b&cshid=..
2021.09.05 -
(진행중...) TESLA) AI DAY에서 자율 주행 AI 기술 보기
최근에 테슬라에서 AI DAY라는 했습니다. 내용 중에서는 휴먼노이드라는 것도 나왔지만, 일단은 잘 모르겠고... 자율 주행을 어떻게 하겠다라는 것에 대한 내용이 나온 것 같아서 정리하고자 합니다. 이번 정리를 통해 알고자 하는 것은 남들은 다 LIDAR 기술이 필요하다는 데 이것을 카메라 기술만 가지고 어떻게 대체할 수 있을 지가 알고 싶었습니다. 현재까지는 영상에 나온 것을 단순 캡처한 것이므로, 영상을 보시는 것을 추천합니다! (진행중...) https://www.youtube.com/watch?v=j0z4FweCy4M&ab_channel=Tesla 목차 자율 주행 카메라 8대 사용 카메라를 사용하였고, 이것을 통해 속도, 신호 등등을 분석함. Recitfy (Image Preprocessing M..
2021.08.22 -
Paper) Reinforcement Learning for Solving the Vehicle Routing Problem
https://arxiv.org/abs/1802.04240 해당 논문을 인용한 논문들 https://scholar.google.com/scholar?as_ylo=2021&hl=en&as_sdt=2005&sciodt=0,5&cites=7637833782499120275&scipsc= Google Scholar EG Talbi - ACM Computing Surveys (CSUR), 2021 - dl.acm.org During the past few years, research in applying machine learning (ML) to design efficient, effective, and robust metaheuristics has become increasingly popular. Many ..
2021.08.21 -
Paper) Perceiver IO (다양한 데이터를 처리할 수 있는 아키텍처)
정리하자면, 딥마인드에서 새로운 논문을 냈고, 내용은 하나의 데이터 타입이 아닌 어떤 데이터셋이 와도 처리할 수 있는 아키텍처를 제안했다. 보통 모델이 한번 잘 적합하게 되면 다른 작업에서는 바꿔서 사용할 수 없는 어려움이 있다. 이 제약은 많은 작업이 시각 및 오디오와 같은 다양한 입력을 필요로 하는 인간 인지와 매우 대조된다고 하며, 최근 DeepMind는 다양한 유형의 입력 데이터 세트를 처리할 수 있는 범용 아키텍처를 공개하는 두 개의 논문을 발표했다. “Perceiver: General Perception with Iterative Attention” “Perceiver IO: A General Architecture for Structured Inputs & Outputs” 첫번째 논문에서는 ..
2021.08.12