All I Need Is Data.

우연히 유튜브를 보다가 해당 논문을 가지고 소개한 글을 보게 되어, 마침 이 주제에 관심이 있었는데 보게 되었습니다.여기서 읽어보다보니 가장 궁금한 것은 시맨틱 검색이 왜 BM25보다 떨어지는 경우가 많고 그거에 대한 수학적인 근거를 알 수 있고 그러면 질문 유형별로 어떻게 대처하면 좋을 지에 대한 힌트를 얻을 수 있었던 것 같다1. 기초 개념 정리임베딩(Embedding)이란?텍스트를 고정된 차원의 벡터로 변환하는 방식유사한 의미를 가진 문장이나 문서가 가까운 벡터가 되도록 학습됨일반적으로 코사인 유사도로 유사도를 판단함벡터 검색(Vector Search)이란?쿼리도 임베딩 벡터로 만들고 전체 문서 중 가장 가까운 벡터를 찾아서 "관련 문서"로 간주함 “모든 쿼리와 문서를 숫자 벡터 하나로 바꾼 뒤, ..

https://playmcp.kakao.com/toolbox PlayMCP | 새로운 AI 경험의 시작PlayMCP와 함께하는 AI 에이전트 세상, 새로운 AI 경험을 만들어 보세요.playmcp.kakao.com 이번에 카카오에서 PlayMCP라는 것을 만들어서 사용해보고자 한다.ChatGPT랑 카카오에 나챗방이랑 연계를 안전하게 쓸 수 있다는 게 장점인 것 같아 테스트해보고자 한다. 일단 아래는 카카오에서 제공한 가이드인데 실제 초반에 생성할 때 단계가 달라서 혼란스러웠다.그래서 다음과 같은 순서로 작업해야 한다.1. 우선 앱에서 고급설정을 누르면 개발자 모드를 활성화해야한다.2. 그러면 위에 앱 만들기가 뜨게 된다. 앱만들기를 클릭하자그러면 위에서 나온 가이드를 그대로 따라서 실행할 수 있다. ht..

사내에서 Gitlab을 사용중인데, 잠시 서버가 내려가 다른 쪽에 코드를 옮길 때 당황했던 경험을 오늘 하여 내용을 정리해보고자 한다.물론 실 사례 내용은 적기가 애매하여 대략적인 상황을 작성하고 개념에 대한 내용과 그래서 앞으로 어떻게 할 지에 대해서 정리해보겠습니다. 상황 정리기존에 잘 쓰던 Git 서버(GitLab 등)가 내려갔다새로 배포해야 할 최종 코드가 로컬에 있다Git으로 관리 중이었고, 아직 push 하지 못한 커밋들이 있다목표는 새로운 Git 서버(GitHub)에 코드를 올리고 main에 merge하는 것이 상태에서 초보자가 가장 많이 하는 실수는“push부터 어떻게 할지”를 먼저 고민하는 것이다.하지만 이 상황에서 제일 중요한 건 push가 아니다. 1. 이 상황에서 가장 먼저 확인해야..

요즘 논문 읽기에는 시간이 부족하여 GPT5.2로 돌려보면서 정리하였습니다궁금한 점을 물어보면서 정리하였습니다.Perplexity 논문을 보면서 다양하게 분석한 것 같고, 사용자 질의에 저렇게 토픽을 다는 작업을 대화 하나 하나에 했을 것 같아 대단하다고 생각합니다.이번 논문을 통해서 일반적인 검색 서비스에서 어떤 사용자들이 많이 어떤 걸 검색하고 활용하는 지 알 수 있어서 좋았습니다. 1. 논문 개요이 논문은 일반-목적 AI 에이전트가 실제로 어떻게 채택되고 사용되는지를 대규모 실사용 데이터를 통해 분석한 연구입니다.Perplexity가 개발한 AI-기반 브라우저 Comet과 그 안의 AI 에이전트(Comet Assistant) 를 중심으로, 수백만 건 이상의 익명 상호작용 데이터를 대상으로 세 가지 ..

0. 왜 이 이슈를 정리할 가치가 있나2025년 말 공개된 React2Shell 취약점(CVE-2025-55182) 은 단순한 “라이브러리 버그”가 아니다.이 사건은 다음 질문을 강하게 던진다.“우리가 프레임워크를 신뢰한다는 건, 어디까지 책임을 위임하는 걸까?”특히 React Server Components(RSC) 를 사용하는 서비스라면,이 취약점은 설계 수준에서의 리스크를 다시 보게 만드는 계기다. 1. React2Shell이란 무엇인가React2Shell은React의 Server Components(RSC) 요청을 처리하는 과정에서👉 역직렬화(deserialization) 로직을 악용해 서버에서 임의 코드 실행(RCE) 이 가능해지는 취약점이다.영향도: CVSS 10.0 (Critical)공격 ..

ChatGPT로 내용을 정리하고 배울점을 정리해보라고 시켜봤습니다.Cloudflare 최근 장애 — 무슨 일이 일어났나 (기술 중심 정리)어떤 장애가 있었나 — 두 사건2025-11-18 장애: Bot Management 관련 구성 파일 버그로 인한 대규모 서비스 중단 2025-12-05 장애: 보안 업데이트로 WAF(Web Application Firewall) 설정 변경 중에 발생한 오류로 약 25분간 네트워크 장애 https://blog.cloudflare.com/18-november-2025-outage/?utm_source=chatgpt.com/ Cloudflare outage on November 18, 2025Cloudflare suffered a service outage on Novemb..

2025-11-27 버전 기준이며, 시간이 지나면서 내용이 변경될 수 있습니다. https://ai.google.dev/gemini-api/docs/prompting-strategies?hl=ko#gemini-3 2025-11-27 버전 기준이며, 시간이 지나면서 내용이 변경될 수 있습니다. 요즘 GEMINI-3가 나오면서 GPT를 뛰어 넘는 성능이 나왔다고 뉴스에서나 개발자들 사이에서 말이 많이 나아고 있는 것 같습니다.그래서 이번에 GOOGLE에서 제공하는 API 문서를 통해 프롬프트에 대해서 학습을 해보면 좋을 것 같아 정리해봤습니다. 우선 문서에서 흔하게 저지르는 실수를 정리한 부분에 대해서 알아보고자 합니다. Gemini 프롬프트 작성 시 사용자가 흔히 저지르는 실수들 1. Zero-s..

GPT가 안되서 보니 Cloudflare 에러라고 해서 간단하게 확인🚨 2025년 11월 18일 Cloudflare 오류 보고 요약문제 발생: Cloudflare 내부 서비스 성능 저하(Internal Service Degradation)가 발생했습니다.오류 유형: Cloudflare 네트워크를 사용하는 고객들이 광범위한 500 오류를 경험하고 있으며, 이는 서버 측의 문제(HTTP 500 Error: Internal Server Error)를 의미합니다.영향 범위: Cloudflare에 의존하는 X(이전 트위터), OpenAI (ChatGPT), League of Legends 등 수많은 주요 웹사이트와 서비스가 간헐적으로 접속 오류나 높은 오류율을 보였습니다. Cloudflare 대시보드와 API ..

coroutine 기초 개념coroutine : 나중에 다시 실행할 수 있는 함수 (일시 정지가 가능한 함수)정의async def 로 정의된 함수가 ‘코루틴 객체’를 만든다.중요한 특징 3개실행하면 바로 실행되지 않고 “코루틴 객체”만 반환됨내부에서 await을 만나면 즉시 멈춤(suspend)나중에 event loop가 재개(resume)시킴즉, 코루틴은:"스스로 멈췄다가 나중에 다시 실행될 수 있는 함수" async def work(): print("시작") await asyncio.sleep(1) print("다시 시작") 왜 필요해?동기 함수처럼 “한 번 시작하면 끝까지 달림”이면,다른 작업들이 모두 막히기 때문.코루틴은:“난 여기까지 했고, 지금은 I/O 기다려야 하니까eve..

OpenAI에서 정리한 문서이고 간단하게 정리하면 다음과 같습니다 이 문서는 ‘긴 대화 속에서 AI가 필요한 것만 기억하고, 불필요한 정보는 버리거나 압축해 효율적으로 대화를 이어가도록 하기 위한 컨텍스트 관리 전략(트리밍 vs 요약)과 그 구현 방법(TrimmingSession / SummarizingSession)을 설명하는 가이드 실제 개발을 하다 보면 멀티턴 시 대화를 어떻게 처리할까에 대한 고민을 많이 하게 됩니다. 이 글에서는 OpenAI에서 만든 Context Engineering 가이드를 보고 어떻게 하는 게 좋은 지 배워보고자 합니다. 문서 전체 핵심 요약1) 왜 컨텍스트 관리가 필요한가LLM은 대화 전체를 계속 기억한다 → 길어질수록 비용 증가, 속도 저하, 오류 증가, 맥락 왜곡 발..

LLM 기반 앱은 “어디서” 틀렸는지 보기가 어렵습니다. 모델, 프롬프트, 체인, 툴 호출, 파서… 층이 많죠. 이 글은 LangChain 공식 문서(How to Debug)를 바탕으로 바로 써먹을 디버깅 루틴을 정리했습니다. 왜 디버깅이 더 어렵나?결정적 로직(deterministic)보다 확률적 출력 확률이 큼 → 같은 입력도 결과가 흔들림체인/에이전트 내부에 여러 단계(프롬프트→모델→툴→파서)가 얽힘에러가 나도 “어느 지점에서 깨졌는지” 로그가 부족한 경우가 많음이 때문에 “흐름을 먼저 보는 로그” → “내부를 다 까보는 로그” → “운영 시각화/추적” 순서로 계층화가 필요합니다. 최근에 가졌던 경험은 gpt-4o-mini 같이 api로 제공하는 모델들은 파싱이 잘되지만 오픈 소스 언어모델로 하..

최근 OpenAI API를 structured outputs 모드로 호출하다가, 간헐적으로 이런 에러를 맞닥뜨렸습니다:openai.LengthFinishReasonError: Could not parse response content as the length limit was reached - CompletionUsage(completion_tokens=16000, prompt_tokens=3501, total_tokens=19501, ...) 아래 글들에서 공통적으로 지적된 포인트는:모델이 반복(loop) 출력을 하거나 structured format이 꼬이면서 불필요하게 길어지는 경우동시 요청(concurrency) 시 내부 토큰 관리가 불안정해지는 경우max_tokens 여유 설정이 부족할 때 발생..

AI 도구

AI 도구 사이드 패널

티스토리툴바