논문 리뷰-단일 시맨틱 검색의 한계-On the Theoretical Limitations ofEmbedding-Based Retrieval
·
관심있는 주제/LLM
우연히 유튜브를 보다가 해당 논문을 가지고 소개한 글을 보게 되어, 마침 이 주제에 관심이 있었는데 보게 되었습니다.여기서 읽어보다보니 가장 궁금한 것은 시맨틱 검색이 왜 BM25보다 떨어지는 경우가 많고 그거에 대한 수학적인 근거를 알 수 있고 그러면 질문 유형별로 어떻게 대처하면 좋을 지에 대한 힌트를 얻을 수 있었던 것 같다1. 기초 개념 정리임베딩(Embedding)이란?텍스트를 고정된 차원의 벡터로 변환하는 방식유사한 의미를 가진 문장이나 문서가 가까운 벡터가 되도록 학습됨일반적으로 코사인 유사도로 유사도를 판단함벡터 검색(Vector Search)이란?쿼리도 임베딩 벡터로 만들고 전체 문서 중 가장 가까운 벡터를 찾아서 "관련 문서"로 간주함 “모든 쿼리와 문서를 숫자 벡터 하나로 바꾼 뒤, ..
ChatGPT에서 PlayMCP 사용해보기
·
꿀팁 분석 환경 설정/MCP
https://playmcp.kakao.com/toolbox PlayMCP | 새로운 AI 경험의 시작PlayMCP와 함께하는 AI 에이전트 세상, 새로운 AI 경험을 만들어 보세요.playmcp.kakao.com 이번에 카카오에서 PlayMCP라는 것을 만들어서 사용해보고자 한다.ChatGPT랑 카카오에 나챗방이랑 연계를 안전하게 쓸 수 있다는 게 장점인 것 같아 테스트해보고자 한다. 일단 아래는 카카오에서 제공한 가이드인데 실제 초반에 생성할 때 단계가 달라서 혼란스러웠다.그래서 다음과 같은 순서로 작업해야 한다.1. 우선 앱에서 고급설정을 누르면 개발자 모드를 활성화해야한다.2. 그러면 위에 앱 만들기가 뜨게 된다. 앱만들기를 클릭하자그러면 위에서 나온 가이드를 그대로 따라서 실행할 수 있다. ht..
Private GitLab에서 다른 서버(GitHub 또는 Gitlab)로 옮기다 push가 막혔을 때 내가 배운 것
·
개발/Git
사내에서 Gitlab을 사용중인데, 잠시 서버가 내려가 다른 쪽에 코드를 옮길 때 당황했던 경험을 오늘 하여 내용을 정리해보고자 한다.물론 실 사례 내용은 적기가 애매하여 대략적인 상황을 작성하고 개념에 대한 내용과 그래서 앞으로 어떻게 할 지에 대해서 정리해보겠습니다. 상황 정리기존에 잘 쓰던 Git 서버(GitLab 등)가 내려갔다새로 배포해야 할 최종 코드가 로컬에 있다Git으로 관리 중이었고, 아직 push 하지 못한 커밋들이 있다목표는 새로운 Git 서버(GitHub)에 코드를 올리고 main에 merge하는 것이 상태에서 초보자가 가장 많이 하는 실수는“push부터 어떻게 할지”를 먼저 고민하는 것이다.하지만 이 상황에서 제일 중요한 건 push가 아니다. 1. 이 상황에서 가장 먼저 확인해야..
논문리뷰-Perplexity 사용자 분석 논문-The Adoption and Usage of AI Agents: Early Evidence from Perplexity
·
관심있는 주제/논문리뷰
요즘 논문 읽기에는 시간이 부족하여 GPT5.2로 돌려보면서 정리하였습니다궁금한 점을 물어보면서 정리하였습니다.Perplexity 논문을 보면서 다양하게 분석한 것 같고, 사용자 질의에 저렇게 토픽을 다는 작업을 대화 하나 하나에 했을 것 같아 대단하다고 생각합니다.이번 논문을 통해서 일반적인 검색 서비스에서 어떤 사용자들이 많이 어떤 걸 검색하고 활용하는 지 알 수 있어서 좋았습니다. 1. 논문 개요이 논문은 일반-목적 AI 에이전트가 실제로 어떻게 채택되고 사용되는지를 대규모 실사용 데이터를 통해 분석한 연구입니다.Perplexity가 개발한 AI-기반 브라우저 Comet과 그 안의 AI 에이전트(Comet Assistant) 를 중심으로, 수백만 건 이상의 익명 상호작용 데이터를 대상으로 세 가지 ..
React2Shell: React Server Components에서 발생한 치명적 RCE 취약점 정리
·
관심있는 주제
0. 왜 이 이슈를 정리할 가치가 있나2025년 말 공개된 React2Shell 취약점(CVE-2025-55182) 은 단순한 “라이브러리 버그”가 아니다.이 사건은 다음 질문을 강하게 던진다.“우리가 프레임워크를 신뢰한다는 건, 어디까지 책임을 위임하는 걸까?”특히 React Server Components(RSC) 를 사용하는 서비스라면,이 취약점은 설계 수준에서의 리스크를 다시 보게 만드는 계기다. 1. React2Shell이란 무엇인가React2Shell은React의 Server Components(RSC) 요청을 처리하는 과정에서👉 역직렬화(deserialization) 로직을 악용해 서버에서 임의 코드 실행(RCE) 이 가능해지는 취약점이다.영향도: CVSS 10.0 (Critical)공격 ..
Cloudeflare 사건에 대한 정리 및 AI 서비스 개발자로 참고할 점
·
포스팅 후보
ChatGPT로 내용을 정리하고 배울점을 정리해보라고 시켜봤습니다.Cloudflare 최근 장애 — 무슨 일이 일어났나 (기술 중심 정리)어떤 장애가 있었나 — 두 사건2025-11-18 장애: Bot Management 관련 구성 파일 버그로 인한 대규모 서비스 중단 2025-12-05 장애: 보안 업데이트로 WAF(Web Application Firewall) 설정 변경 중에 발생한 오류로 약 25분간 네트워크 장애 https://blog.cloudflare.com/18-november-2025-outage/?utm_source=chatgpt.com/ Cloudflare outage on November 18, 2025Cloudflare suffered a service outage on Novemb..
GEMINI API 문서를 통해 프롬프트 설계 공부하기
·
꿀팁 분석 환경 설정/GPTs
2025-11-27 버전 기준이며, 시간이 지나면서 내용이 변경될 수 있습니다. https://ai.google.dev/gemini-api/docs/prompting-strategies?hl=ko#gemini-3 2025-11-27 버전 기준이며, 시간이 지나면서 내용이 변경될 수 있습니다. 요즘 GEMINI-3가 나오면서 GPT를 뛰어 넘는 성능이 나왔다고 뉴스에서나 개발자들 사이에서 말이 많이 나아고 있는 것 같습니다.그래서 이번에 GOOGLE에서 제공하는 API 문서를 통해 프롬프트에 대해서 학습을 해보면 좋을 것 같아 정리해봤습니다. 우선 문서에서 흔하게 저지르는 실수를 정리한 부분에 대해서 알아보고자 합니다. Gemini 프롬프트 작성 시 사용자가 흔히 저지르는 실수들 1. Zero-s..
Cloudflare down 으로 인한 ChatGPT 사용 불가 이슈
·
꿀팁 분석 환경 설정/GPTs
GPT가 안되서 보니 Cloudflare 에러라고 해서 간단하게 확인🚨 2025년 11월 18일 Cloudflare 오류 보고 요약문제 발생: Cloudflare 내부 서비스 성능 저하(Internal Service Degradation)가 발생했습니다.오류 유형: Cloudflare 네트워크를 사용하는 고객들이 광범위한 500 오류를 경험하고 있으며, 이는 서버 측의 문제(HTTP 500 Error: Internal Server Error)를 의미합니다.영향 범위: Cloudflare에 의존하는 X(이전 트위터), OpenAI (ChatGPT), League of Legends 등 수많은 주요 웹사이트와 서비스가 간헐적으로 접속 오류나 높은 오류율을 보였습니다. Cloudflare 대시보드와 API ..
Python) asyncio 기초 공부 및 예시로 알아보기
·
꿀팁 분석 환경 설정/Python
coroutine 기초 개념coroutine : 나중에 다시 실행할 수 있는 함수 (일시 정지가 가능한 함수)정의async def 로 정의된 함수가 ‘코루틴 객체’를 만든다.중요한 특징 3개실행하면 바로 실행되지 않고 “코루틴 객체”만 반환됨내부에서 await을 만나면 즉시 멈춤(suspend)나중에 event loop가 재개(resume)시킴즉, 코루틴은:"스스로 멈췄다가 나중에 다시 실행될 수 있는 함수" async def work(): print("시작") await asyncio.sleep(1) print("다시 시작") 왜 필요해?동기 함수처럼 “한 번 시작하면 끝까지 달림”이면,다른 작업들이 모두 막히기 때문.코루틴은:“난 여기까지 했고, 지금은 I/O 기다려야 하니까eve..
OpenAI-Context Engineering 가이드(2025.09) 공부해보기
·
관심있는 주제/LLM
OpenAI에서 정리한 문서이고 간단하게 정리하면 다음과 같습니다 이 문서는 ‘긴 대화 속에서 AI가 필요한 것만 기억하고, 불필요한 정보는 버리거나 압축해 효율적으로 대화를 이어가도록 하기 위한 컨텍스트 관리 전략(트리밍 vs 요약)과 그 구현 방법(TrimmingSession / SummarizingSession)을 설명하는 가이드 실제 개발을 하다 보면 멀티턴 시 대화를 어떻게 처리할까에 대한 고민을 많이 하게 됩니다. 이 글에서는 OpenAI에서 만든 Context Engineering 가이드를 보고 어떻게 하는 게 좋은 지 배워보고자 합니다. 문서 전체 핵심 요약1) 왜 컨텍스트 관리가 필요한가LLM은 대화 전체를 계속 기억한다 → 길어질수록 비용 증가, 속도 저하, 오류 증가, 맥락 왜곡 발..
LangChain 디버깅 가이드: 빠르게 훑고 깊게 파보는 3가지 방법
·
관심있는 주제/LLM
LLM 기반 앱은 “어디서” 틀렸는지 보기가 어렵습니다. 모델, 프롬프트, 체인, 툴 호출, 파서… 층이 많죠. 이 글은 LangChain 공식 문서(How to Debug)를 바탕으로 바로 써먹을 디버깅 루틴을 정리했습니다. 왜 디버깅이 더 어렵나?결정적 로직(deterministic)보다 확률적 출력 확률이 큼 → 같은 입력도 결과가 흔들림체인/에이전트 내부에 여러 단계(프롬프트→모델→툴→파서)가 얽힘에러가 나도 “어느 지점에서 깨졌는지” 로그가 부족한 경우가 많음이 때문에 “흐름을 먼저 보는 로그” → “내부를 다 까보는 로그” → “운영 시각화/추적” 순서로 계층화가 필요합니다. 최근에 가졌던 경험은 gpt-4o-mini 같이 api로 제공하는 모델들은 파싱이 잘되지만 오픈 소스 언어모델로 하..
에러) Structured Output 호출 시 LengthFinishReasonError 문제와 임시 해결기
·
분석 Python/vLLM
최근 OpenAI API를 structured outputs 모드로 호출하다가, 간헐적으로 이런 에러를 맞닥뜨렸습니다:openai.LengthFinishReasonError: Could not parse response content as the length limit was reached - CompletionUsage(completion_tokens=16000, prompt_tokens=3501, total_tokens=19501, ...) 아래 글들에서 공통적으로 지적된 포인트는:모델이 반복(loop) 출력을 하거나 structured format이 꼬이면서 불필요하게 길어지는 경우동시 요청(concurrency) 시 내부 토큰 관리가 불안정해지는 경우max_tokens 여유 설정이 부족할 때 발생..

AI 도구

AI 도구 사이드 패널

아래 AI 서비스 중 하나를 선택하여 블로그를 보면서 동시에 사용해보세요.

API 키를 입력하세요API 키를 저장하려면 저장 버튼을 클릭하세요API 키가 저장되었습니다
API 키를 입력하세요API 키를 저장하려면 저장 버튼을 클릭하세요API 키가 저장되었습니다
API 키를 입력하세요API 키를 저장하려면 저장 버튼을 클릭하세요API 키가 저장되었습니다
URL과 모델을 입력하세요설정을 저장하려면 저장 버튼을 클릭하세요설정이 저장되었습니다