All I Need Is Data.

금융 IT 용어 정리

혹시 모르는 단어가 있다면 아래 홈페이지에서 찾아보길 추천한다. https://newsroom.koscom.co.kr/glossary 금융IT 용어사전 | 코스콤 뉴스룸 newsroom.koscom.co.kr 금융 IT 용어 정리를 다른 사람들의 자료를 가지고 와서 정리하고자 한다. 여전히 여러 개의 계와 데이터 흐름이 아직 잘 와닿지 않는다 정보계에서 먼저 작업을 해서 dw에 넣는 것 인지? 아니면 계정계에서 한 것인지? 고유업무 : 수신, 여신, 외환 부수업무 : 고유업무 + 동반되는 업무 (보증, 어음 인수 등) 겸영업무 : 영업을 겸한다는 뜻, 채권회수(추심)를 대행하거나 기업 M&A를 중개하는 등 본업과는 거리가 멀지만 자본과 관련된 일을 함 많이 나오는 그림이고 크게 계는 1. 계정계 2. 정..

2022.07.21

마케팅에서 페르소나에 대한 자료 정리

페르소나가 정의 페르소나(Persona)는 현재 고객이 누구인지, 물리적 요구와 정서적 요구를 포함하여 고객이 무엇을 구매하도록 유도하는지 명확하게 정의하는 전체적 프로필 즉, 마케팅에서 페르소나는 타켓 고객의 대리이미지로 생성된 가상의 캐릭터 다소 드라이해보이고 불완전한 블럭 조각같은 세그먼트에 깊이와 표정을 주는 것이 바로 페르소나 요리 사이트를 방문하는 40대 여성이라는 세그먼트 → Stylish lady cook 기존 한계 기존에 인구통계적인 세그먼트가 가진 한계 인구 통계학적인 정보 : 어느 의류사이트에 구매의 71%는 여성고객을 통해 발생한다고 해보자 페르소나화한 정보 : 이 웹사이트에서 옷을 자주 사는 ‘Professional mom’ 이라는 페르소나는 주로 아이가 잠든 9시 이후에 쇼핑을 ..

2022.07.17

[ML] 앙상블 모델 테크닉

앙상블 학습 방법 사용의 장점 앙상블 기법을 솔로 모델과 비교하면 앙상블 방법이 더 큰 예측 정확도를 제공한다. 편중(bias)과 분산(variance)은 앙상블을 통해 줄일 수 있다. 대부분의 경우 모델의 과적합 또는 과소적합이 방지됩니다. 앙상블 모델은 더 안정적이고 노이즈가 적다. 앙상블 테크닉 정리 1. Bagging - 단일 데이터세트를 인스턴스별로 하위 집합으로 나눕니다(병렬로 작동) 2. Boosting - 단일 데이터세트를 인스턴스별로 하위 집합으로 나눕니다(순차적으로 작동). 3. Stacking - 다른 분류기 사용 Bagging 배깅의 목표는 많은 모델의 출력을 통합하여 보다 정확한 결과를 제공하는 것이다. 그러나 문제는 모든 모델을 동일한 데이터 집합을 사용하여 만든 다음 결과를 집..

2022.07.16

Customer Segmentation 자료 정리

STR IN AI PAPER : A strategic framework for artificial intelligence in marketing Segmentation, Targeting, Positioning https://www.linkedin.com/pulse/how-use-ai-advanced-targeting-marketing-antonel-neculai/ How to use AI for Advanced Targeting in Marketing Artificial intelligence is a branch of computer science that deals with the simulation of intelligent human behavior by machines. With the hel..

2022.07.10

[Causal Inference] 기본 이해 및 파이썬 라이브러리

AI 모델을 실제 활용하는 데 있어서, 인과 같은 것을 아는 것이 참 중요하다고 생각한다. 현재 해석 가능한 부분에 대한 연구도 진행이 되고 있는데, 아직 까지는 완벽한 방법은 없는 것 같다. 어떠한 모델이든 실제 이 결과가 무엇 때문에 나왔는 지에 대한 부분은 항상 중요하니, 간단한 개념이라도 미리 공부해보려고 한다. 여러 자료를 보고 있으나 아직도 확 와닿지는 않는다.ㅠ 참고) 일단 글 자체가 MICROSOFT에서 쓴 것이라 그런지 결국 라이브러리에서 마이크로소프트 라이브러리를 강조하고 있긴 하다. Introduction 당신이 판매를 증진시키기 위해 특정 고객들에게 credit offer를 확장하기 시작했다고 상상해 보세요. 특가 기간 동안 그 고객들의 구매가 증가한 것을 알 수 있지만, 신용 제안..

2022.07.09

[머신러닝][전처리] 변수 이산화(Discretization) 방법

이산화(Discretization)란 이산화에서는 전체 변수 값 범위에 걸쳐 있는 연속 간격 모음을 생성하여 연속 변수를 이산 기능으로 변환합니다. 이러한 불연속 값은 범주형 데이터로 처리됩니다. 이산화의 첼린지는 연속된 값이 정렬될 간격을 정의하는 임계값 또는 한계를 식별하는 것이다. 이를 위해 우리가 사용할 수 있는 다양한 이산화 방법이 있는데, 각각 장단점이 있다. 필요한 이유 의사 결정 트리(decision treeo) 및 Naive Bayes와 같은 여러 회귀 및 분류 모델은 이산 값에서 더 나은 성능을 보입니다. 의사 결정 트리는 속성의 이산적 분할(discrete partitions)에 기초하여 결정을 내린다. 의사 결정 트리는 이상적인 절단점을 결정하기 위해 훈련하는 동안 모든 featur..

2022.07.09

[TODO] 그래프 타입 알아보기

Directed Graph 정점(Vertex)를 연결하는 간선(Edge)에 방향성을 부여한 그래프 Homogeneous Graph Homogeneous graph는 그래프의 모든 노드가 같은 성질을 갖고 있는 그래프이다. 예를 들어, 인물 관계도가 있다면 모든 노드는 사람을 의미하는 homogeneity를 갖는다. 1. 모든 노드가 하나의 정보를 가진다. 2. 엣지는 하나의 관계 타입을 가진다. 3. 노드들 사이에서 유사성을 정의하기 쉽다. 4. 링크 예측이나 노드 분류 그래프 임베딩을 하는데, 효율적이다. Heterogeneous Graph Heterogeneous graph는 반대로 그래프의 노드가 여러 종류의 성질을 가지는 그래프이다. 예를 들어 영화-유저 그래프는 어떤 노드는 영화이고, 어떤 노드..

2022.06.25

진행중) swin transformer 알아보기

해당 논문을 보고자 하는 이유는 transformer를 사용하고, hierarchical 한 구조를 제시하고, 다양한 task에 적용 가능한 아키텍처인 것 같아 보려고 한다. 아래 DSBA에서 설명해주시는 영상을 보면 잘 설명해주기 때문에 참고하시면 될 것 같다. 이 논문은 컴퓨터 비전의 범용 백본 역할을 할 수 있는 Swin Transformer라는 새로운 비전 트랜스포머를 제시한다. 언어에서 비전으로 트랜스포머를 적응시키는 데 있어 어려움은 시각적 엔티티의 스케일의 큰 차이와 텍스트의 단어에 비해 이미지의 픽셀의 높은 해상도와 같은 두 도메인 간의 차이에서 발생한다. 물체의 크기(the scale of visual entities) 해상도(high resolution of pixels in image..

2022.06.10

논문 리뷰) A Generalist Agent (GATO)

구글에서 일반화되는 에이전트라는 주제로 낸 논문이다. 저자들은 일반화된 이러한 방식을 쓰면, 새롭게 들어온다기보다는 out of distribution에 있는 부분에 대해서도 잘할 것이라고 한다. 즉 완전히 새로운 것보다는 기존에 하던 것 중에서 조금 범위가 넘어가는 것에 대해서 잘할 수 있다고 하는 것 같다. 개인적으로 궁금했던 부분은 인풋과 아웃풋 그리고 손실 함수의 구성 방식이라서 이 부분을 주로 간단하게 보기로 했다. 인풋 기본적으로 인풋 같은 경우 continuous 한 것들을 discrete하게 만들거나 VIT 같은 방식을 도입해서 패치하는 식을 이용했다고 한다. 아직 그래프까지는 커버하는 아키텍처는 아닌 것 같다. continuous 1024개의 uniform unit (여기서는 값 자체보다..

2022.05.25

개선된 OneHotEncoder 알아보기(v1.1 이후)

이번에 scikit-learn에서 버전을 업데이트하면서 OneHotEncoder가 수정이 됐는데, 일반적으로 카테고리 처리하는 데 고민이 되던 부분을 많이 개선해서 올려준 것 같다. 기존에는 하려면, 복잡하게 짜서 해야하지만 이제는 그러지 않아도 돼서 좋은 것 같다 ㅎㅎ https://scikit-learn.org/stable/modules/preprocessing.html#one-hot-encoder-infrequent-categories 6.3. Preprocessing data The sklearn.preprocessing package provides several common utility functions and transformer classes to change raw feature vec..

2022.05.25

논문 리뷰) [TODO] Online Decision Transformer

시간이 나면 보는 걸로... https://arxiv.org/abs/2202.05607 Online Decision Transformer Recent work has shown that offline reinforcement learning (RL) can be formulated as a sequence modeling problem (Chen et al., 2021; Janner et al., 2021) and solved via approaches similar to large-scale language modeling. However, any practical instantiatio arxiv.org

2022.05.25

[ Python ] jpg, png 를 gif 또는 mp4로 만들기

jpg를 gif로 만들려는데, 먼가 잘 안돼서 이것저것 하다가 아는 형의 코드를 참고해서 결국 성공하게 되었다. 이 글에서 포인트는 다음과 같다. 1. 각 이미지 사이즈가 다른 것이 있어서 사이즈를 맞춰주는 작업이 필요함. 2.기존에 하던 방식을 했는데, 작동하지 않아서 새로운 방법으로 gif를 만들었음. 기존 방식) 아래와 같은 방법이 작동하지 않았다. GIF import os os.system('convert -delay 15 -loop 0 ./pngs/*.png ./UI.gif') 일단 이미지 사이즈가 다르니 이미지 사이즈를 맞춰줬다. 사진이 뭉개질까봐 가장 작은 사이즈 기준으로 맞췄다. from PIL import Image import cv2 result = [] for idx , path in..

2022.05.22

All I Need Is Data.

All I Need Is Data.

태그

최근글

댓글

공지사항

아카이브

전체 글(833)

티스토리툴바