관심있는 주제(236)
-
KS(Kolmogorov-Smirnov Statistics) 통계량 알아보기
Kolmogorov-Smirnov(KS) 통계는 예측 모델을 검증하는 데 사용되는 가장 중요한 메트릭 중 하나입니다. 특히 Banking, Financial services and Insurance (BFSI) 도메인에서 자주 사용됩니다. 은행에서 프로젝트를 수행하는 위험 또는 마케팅 분석 팀의 일원이라면 이 지표에 대해 들어봤을 것입니다. 정의 검색을 하면 가장 많이 나오는 정의는 다음과 같습니다. K-S 통계량은 우량 집단과 불량집단의 누적 분포의 차이를 나타내는 지표로 신용평가모형의 변별력 평가 시 주요 판별 통계량으로 활용됩니다. 먼가 금융 용어가 많이 섞여 이해하기 어려울 수 있지만, 간단하게 말하면, 2개의 집단이 동일한 분포를 이루고 있는 지를 검증하는 검증 지표라고 할 수 있습니다. 위에 ..
2022.07.30 -
정의 및 비교) Data Warehouse, Data Base, Data Lake, Data Mart
다른 내용을 정리하다가 헷갈려서 따로 정리를 해보고자 한다. 주로 DW와 다른 것들을 비교한 자료들을 토대로 정리했다. 필자가 전문적으로 배운 것이 아니라 표현을 하는 데 있어서 부족함이 있을 수 있어서, 부족한 부분 댓글로 상세하게 작성 부탁드린다. :) Data Warehouse(DW) ODS 데이터들을 활용이 가능한 형태로 만들어 저장하고 관리, 분석할 수 있는 시스템 데이터 웨어하우스는 보다 정보에 입각한 의사 결정을 내릴 수 있도록 분석 가능한 정보의 중앙 리포지토리 데이터는 트랜잭션 시스템, 관계형 데이터베이스 및 기타 소스로부터 보통 정기적으로 데이터 웨어하우스로 들어감 DW의 아키텍처 그림은 아래와 같다고 한다. 비즈니스 애널리스트, 데이터 엔지니어, 데이터 사이언티스트 및 의사 결정권자는..
2022.07.26 -
금융 IT 용어 정리
혹시 모르는 단어가 있다면 아래 홈페이지에서 찾아보길 추천한다. https://newsroom.koscom.co.kr/glossary 금융IT 용어사전 | 코스콤 뉴스룸 newsroom.koscom.co.kr 금융 IT 용어 정리를 다른 사람들의 자료를 가지고 와서 정리하고자 한다. 여전히 여러 개의 계와 데이터 흐름이 아직 잘 와닿지 않는다 정보계에서 먼저 작업을 해서 dw에 넣는 것 인지? 아니면 계정계에서 한 것인지? 고유업무 : 수신, 여신, 외환 부수업무 : 고유업무 + 동반되는 업무 (보증, 어음 인수 등) 겸영업무 : 영업을 겸한다는 뜻, 채권회수(추심)를 대행하거나 기업 M&A를 중개하는 등 본업과는 거리가 멀지만 자본과 관련된 일을 함 많이 나오는 그림이고 크게 계는 1. 계정계 2. 정..
2022.07.21 -
마케팅에서 페르소나에 대한 자료 정리
페르소나가 정의 페르소나(Persona)는 현재 고객이 누구인지, 물리적 요구와 정서적 요구를 포함하여 고객이 무엇을 구매하도록 유도하는지 명확하게 정의하는 전체적 프로필 즉, 마케팅에서 페르소나는 타켓 고객의 대리이미지로 생성된 가상의 캐릭터 다소 드라이해보이고 불완전한 블럭 조각같은 세그먼트에 깊이와 표정을 주는 것이 바로 페르소나 요리 사이트를 방문하는 40대 여성이라는 세그먼트 → Stylish lady cook 기존 한계 기존에 인구통계적인 세그먼트가 가진 한계 인구 통계학적인 정보 : 어느 의류사이트에 구매의 71%는 여성고객을 통해 발생한다고 해보자 페르소나화한 정보 : 이 웹사이트에서 옷을 자주 사는 ‘Professional mom’ 이라는 페르소나는 주로 아이가 잠든 9시 이후에 쇼핑을 ..
2022.07.17 -
Customer Segmentation 자료 정리
STR IN AI PAPER : A strategic framework for artificial intelligence in marketing Segmentation, Targeting, Positioning https://www.linkedin.com/pulse/how-use-ai-advanced-targeting-marketing-antonel-neculai/ How to use AI for Advanced Targeting in Marketing Artificial intelligence is a branch of computer science that deals with the simulation of intelligent human behavior by machines. With the hel..
2022.07.10 -
[Causal Inference] 기본 이해 및 파이썬 라이브러리
AI 모델을 실제 활용하는 데 있어서, 인과 같은 것을 아는 것이 참 중요하다고 생각한다. 현재 해석 가능한 부분에 대한 연구도 진행이 되고 있는데, 아직 까지는 완벽한 방법은 없는 것 같다. 어떠한 모델이든 실제 이 결과가 무엇 때문에 나왔는 지에 대한 부분은 항상 중요하니, 간단한 개념이라도 미리 공부해보려고 한다. 여러 자료를 보고 있으나 아직도 확 와닿지는 않는다.ㅠ 참고) 일단 글 자체가 MICROSOFT에서 쓴 것이라 그런지 결국 라이브러리에서 마이크로소프트 라이브러리를 강조하고 있긴 하다. Introduction 당신이 판매를 증진시키기 위해 특정 고객들에게 credit offer를 확장하기 시작했다고 상상해 보세요. 특가 기간 동안 그 고객들의 구매가 증가한 것을 알 수 있지만, 신용 제안..
2022.07.09 -
[TODO] 그래프 타입 알아보기
Directed Graph 정점(Vertex)를 연결하는 간선(Edge)에 방향성을 부여한 그래프 Homogeneous Graph Homogeneous graph는 그래프의 모든 노드가 같은 성질을 갖고 있는 그래프이다. 예를 들어, 인물 관계도가 있다면 모든 노드는 사람을 의미하는 homogeneity를 갖는다. 1. 모든 노드가 하나의 정보를 가진다. 2. 엣지는 하나의 관계 타입을 가진다. 3. 노드들 사이에서 유사성을 정의하기 쉽다. 4. 링크 예측이나 노드 분류 그래프 임베딩을 하는데, 효율적이다. Heterogeneous Graph Heterogeneous graph는 반대로 그래프의 노드가 여러 종류의 성질을 가지는 그래프이다. 예를 들어 영화-유저 그래프는 어떤 노드는 영화이고, 어떤 노드..
2022.06.25 -
진행중) swin transformer 알아보기
해당 논문을 보고자 하는 이유는 transformer를 사용하고, hierarchical 한 구조를 제시하고, 다양한 task에 적용 가능한 아키텍처인 것 같아 보려고 한다. 아래 DSBA에서 설명해주시는 영상을 보면 잘 설명해주기 때문에 참고하시면 될 것 같다. 이 논문은 컴퓨터 비전의 범용 백본 역할을 할 수 있는 Swin Transformer라는 새로운 비전 트랜스포머를 제시한다. 언어에서 비전으로 트랜스포머를 적응시키는 데 있어 어려움은 시각적 엔티티의 스케일의 큰 차이와 텍스트의 단어에 비해 이미지의 픽셀의 높은 해상도와 같은 두 도메인 간의 차이에서 발생한다. 물체의 크기(the scale of visual entities) 해상도(high resolution of pixels in image..
2022.06.10 -
논문 리뷰) A Generalist Agent (GATO)
구글에서 일반화되는 에이전트라는 주제로 낸 논문이다. 저자들은 일반화된 이러한 방식을 쓰면, 새롭게 들어온다기보다는 out of distribution에 있는 부분에 대해서도 잘할 것이라고 한다. 즉 완전히 새로운 것보다는 기존에 하던 것 중에서 조금 범위가 넘어가는 것에 대해서 잘할 수 있다고 하는 것 같다. 개인적으로 궁금했던 부분은 인풋과 아웃풋 그리고 손실 함수의 구성 방식이라서 이 부분을 주로 간단하게 보기로 했다. 인풋 기본적으로 인풋 같은 경우 continuous 한 것들을 discrete하게 만들거나 VIT 같은 방식을 도입해서 패치하는 식을 이용했다고 한다. 아직 그래프까지는 커버하는 아키텍처는 아닌 것 같다. continuous 1024개의 uniform unit (여기서는 값 자체보다..
2022.05.25 -
논문 리뷰) [TODO] Online Decision Transformer
시간이 나면 보는 걸로... https://arxiv.org/abs/2202.05607 Online Decision Transformer Recent work has shown that offline reinforcement learning (RL) can be formulated as a sequence modeling problem (Chen et al., 2021; Janner et al., 2021) and solved via approaches similar to large-scale language modeling. However, any practical instantiatio arxiv.org
2022.05.25 -
[Paper][RL] [ToDo]Mutual Information State Intrinsic Control 리뷰
https://arxiv.org/abs/2103.08107#:~:text=Reinforcement%20learning%20has%20been%20shown,defining%20an%20intrinsic%20reward%20function. Mutual Information State Intrinsic Control Reinforcement learning has been shown to be highly successful at many challenging tasks. However, success heavily relies on well-shaped rewards. Intrinsically motivated RL attempts to remove this constraint by defining an..
2022.05.19 -
[RL] PPO 학습 중에 nan 나오는 특이한 경우
강화 학습 학습 도중에 에러가 나는 경우를 공유한다. 바로 액션 공간이 좀 큰 상황에서 특정 값이 너무 작게 나오는 데 선택하는 경우이다. 아래처럼 예시를 만들면 다음과 같다. 특정 logit들은 엄청 크게 나오지만, 한 개의 logit은 엄청 작게 나오는 데 그것을 선택하는 경우 문제가 발생한다. 바로 아래와 같은 경우이다. logit = torch.randint(low=1000000,high=2000000,size=(1,128*128*2)) logit[0,0] = 1e-4567 dist = Categorical(logits=logit) log_prob = dist.log_prob(torch.tensor([0])) ## tensor([-1999934.]) PPO에서는 아시다시피 old log prob와..
2022.05.12