전체 글(857)
-
API Testing 내용 정리 및 AI Agent Test 방법론 추가 정리
링크드인에서 API 테스트에 대한 좋은 글을 찾게 되었고, 해당 글을 정리하면서 요즘 핫한 AI Agent 테스트 방법론에 대해서도 정리를 해보고자 합니다.정답은 아니겠지만, 참고해주시면 좋을 것 같습니다.생각보다 AI AGENT에 대한 테스트가 단순해질줄 알았는데, 모델이 더 늘어나다 보니, 체크를 해야합니다. 일반적인 API Testing (9개)1. 스모크 테스트 (Smoke Testing)목적: API의 주요 기능이 정상적으로 작동하는지 빠르게 확인하여, 상세한 테스트에 앞서 시스템이 준비되었는지 판단합니다.방법: 기본적인 API 엔드포인트에 요청을 보내어 정상적인 응답을 확인합니다.Amazon Web Services, Inc.예시: /api/health-check 엔드포인트에 GET 요청을 ..
2025.04.09 -
[mcp-directory] mcp 서버 관리 화면 오픈소스 버전 소개 및 개선해보기
아래와 같이 요즘 mcp server 가 유행이 되면서 관리를 하는 페이지가 인기입니다.여기다가 회사에서 작업하는 것을 올리기는 부담스럽고, https 로 해야하니 따로 구축하고 싶다는 생각이 들었습니다.그리고 사내에서 쓴다는 생각으로 사내에서 접근 가능한 것만 따로 관리하고 싶었습니다.https://smithery.ai/https://www.claudemcp.com/ko/docs/dev-sse-mcp 그렇게 생각만하다가 우연히 찾은 것이 아래 깃헙 소스입니다.mcp directory 라는 깃헙에서 이러한 것을 찾게 되었습니다물론 이 디렉토리를 만드는 것 자체는 기능상 구현하기에는 크게 어려운 기능이 없어서 금방 할 수 있겠지만, 열심히 만들어 주신 것이 있으니 활용해보고 싶었습니다.https://gi..
2025.04.05 -
[Dify] Speech2Text 관련 모델 파라미터 찾아보기 (진행중)
문제점dify에 open-source 모델에 vllm openai-compatible 하게 서빙을 한 stt 모델을 테스트하는 데, 자꾸 영어로 변환되는 문제가 발생했다. 그래서 vllm 로그를 보니 다음과 같이 나왔다.vllm 파라미터를 찾아봤지만 저 부분을 로 바꾸는 파라미터를 찾을 수가 없었다.prompt: '' 그렇다고 실제로 dify에서도 STT 모델에 대해서 Language를 바꾸는 기능을 제공하지 않았다. 코드 분석해보기Repository : dify 그래서 우선 코드에서 찾아보기로 하였다.결론적으로 직접적으로 수정하는 부분을 찾지 못했지만 다음과 같은 부분을 찾았다.앞에 front에서부터 관련된 부분을 찾았다./web\app\components\base\voice-input\index.t..
2025.03.29 -
[Obsidian] CURSOR Editor를 AI 문서 편집툴로 활용하기
소개마크다운 문서 작성과 지식 관리에 Obsidian을 사용하고 계신가요? Cursor의 강력한 AI 기능을 Obsidian과 함께 사용하면 노션과 같은 직관적인 편집 경험과 AI 보조 기능을 동시에 활용할 수 있습니다. 이 글에서는 Cursor와 Obsidian을 연동하여 마크다운 문서를 더 효율적으로 편집하는 방법을 소개합니다.Cursor와 Obsidian 설정하기필요한 도구Cursor - AI 기능이 내장된 코드 에디터Obsidian - 마크다운 기반 지식 관리 도구연동 방법Obsidian 볼트(Vault)를 Cursor에서 폴더로 열기Cursor에서 마크다운 파일 편집 모드 활성화마크다운 에디터 전환 기능 활용하기Cursor에서는 명령어 팔레트를 통해 마크다운 에디터를 쉽게 전환할 수 있습니다. ..
2025.03.23 -
CURSOR 잘 사용하기(0.46 버전 기준)-25.03.03 (.cursorrules / .cursorindexingignore, .cursorignore)
CURSOR가 이번에 업데이트가 되면서, 화면 구조가 바뀌었고, 몇몇 기능이 추가가 되었다.추가가 된 김에 잘 사용하려면 어떤 것을 해야할 지 정리해보고자 한다. 아래 블로그에 잘 정리되어 있어서, 이걸 보시는 것도 추천드립니다.특히 MCP에 대한 설명에 대해서 상세하게 작성해줘서 MCP가 필요한 부분은 참고하시면 좋을 것 같습니다. https://youtu.be/f2ibNsDdJ0U?si=t9YOSBeUssVf5UD8 주오 업데이트 (0.46.x)1. Agent가 기본 모드로 설정됨이전에는 Chat, Composer, Agent 세 가지 모드가 존재했지만, 이제는 Agent가 기본 모드가 되어 보다 강력하고 통합된 AI 경험을 제공합니다.이를 통해 사용자가 모드를 전환하는 과정에서 혼란을 줄이고, 하..
2025.03.03 -
논문 및 코드 리뷰) s1: Simple test-time scaling (50달러로 o1 만드는 방법 논문)
GPT를 활용하여 작성하였습니다 배경어쩌다가 뉴스 기사를 통해 보게 되었고, 내용을 대충 보니 데이터를 어떻게 쌓으면 되는지 그리고 어떤 식으로 학습하면 되는지 그리고 깃헙을 제공하다 보니, 관심을 가지게 되었고, 읽게 되었습니다.그래서 이 논문을 통해 알고자 하는 부분은 어떻게 데이터를 뽑았는 지, 그리고 어떻게 저렴한 비용으로 해당 모델을 만들 수 있는 지를 알고자 읽어보게 되었습니다. 이 논문의 핵심 내용은 Test-time scaling(테스트 시 스케일링)이라는 개념을 활용하여 언어 모델의 성능을 향상시키는 방법을 연구하는 것입니다. 기존에 OpenAI의 o1 모델이 이를 구현했지만, 구체적인 방법이 공개되지 않아 이를 복제하려는 여러 시도가 있었습니다. 연구진은 가능한 한 가장 단순한 방..
2025.02.09 -
논문 정리) DeepSeek (V3,R1) 논문을 보면서 기술적인 부분 알아보기
GPT와 함께 아래 내용들을 정리했습니다. 2025년 1월, 핫하게 떠오른 DeepSeek 모델최근 AI 업계에서 뜨거운 화제가 되고 있는 DeepSeek 모델을 살펴보자.이 모델은 헤지펀드 하이 플라이어 퀀트라는 기업에서 개발한 것으로, 해당 기업은 550만 달러의 비용으로 현재까지 가장 뛰어난 오픈 소스 언어 모델을 만들었다고 주장하고 있다.NVIDIA 칩 의존도를 낮춘 혁신DeepSeek 개발진은 "꼭 최고의 NVIDIA 칩이 아니더라도 고성능 모델을 개발할 수 있다"고 자신 있게 발표했다.실제로 DeepSeek은 오픈 소스 모델 중 최고의 성능을 기록했으며, 폐쇄형 모델인 GPT-4와도 견줄 만한 결과를 보여주었다.이 혁신적인 접근은 업계 전반에 큰 반향을 일으켰으며, 특히 NVIDIA의 주가..
2025.01.27 -
한눈에 보는 2025년 캘린더 [다운로드 가능]
2025 Calendar Visit 2025 Calendar Github Site Your browser does not support iframes. 이벤트를 추가하고 2025년 달력을 한눈에 확인하며 PDF로 저장하여 다운로드할 수 있습니다.
2024.12.27 -
LLM) HuggingFace 모델 다운로드부터 gguf 및 quantization 수행 후 vLLM 서빙하는 순서 정리해보기 (테스트 필요)
qwen2.5-72b를 vllm에 올리는 테스트를 해보는 중에, ollama로 올린 것이 vllm으로 올린 것보다 더 빠른 것을 경험했습니다.vllm에 올린 모델은 허깅페이스에 올라온 모델을 기반으로 테스트했습니다.1. Qwen/Qwen2.5-72B-Instruct-AWQ2. Qwen/Qwen2.5-72B-Instruct-GPTQ-Int8 ollama 역시 양자화된 것인데Q4_K_M으로 양자화된 모델(gguf)임을 알 수 있습니다. 개인적으로 서빙을 할 때 당연히 ollama가 vllm 보다 느릴 줄 알았는데, vllm이 더 느린 것을 보고, 공식적으로 지원하지 않는 모델 같은 경우 느릴 수도 있겠다는 생각이 들었습니다.https://docs.vllm.ai/en/latest/models/supported..
2024.11.16 -
Neural ODE 알아보기
유튜브를 보다가 흥미로운 개념에 대해서 알게 되었는데, 이해가 잘 안돼서 개념이라도 이해해 보고자 정리해 봅니다.특히 시간의 간격이 불규칙한 경우에 rnn 같은 계열의 사용이 어렵다는 것에 대해서 공감하였고, 이러한 문제에 접근하는 방법에 대해서 궁금하게 되어서 정리해보고자 합니다. ODE의 기본 개념 일반적으로, ODE(상미분 방정식)은 변화하는 현상을 설명하는 데 사용하는 수학적인 도구입니다. 예를 들어, 물건을 던졌을 때 그 물체의 위치가 시간이 지남에 따라 어떻게 변하는지 계산하는 식이라고 볼 수 있어요. 이를 통해 속도나 가속도 같은 변화들을 단계별로 계산해 나갈 수 있죠. 미분 방정식은 어떤 종속 변수(yyy)가 독립 변수(xxx)의 변화에 따라 어떻게 변하는지를 설명하는 방정식입니다. 예를..
2024.11.10 -
[Code-Server] 오류 'crypto.subtle‘ is not available so webviews will not work 해결 - Jupyter Extension 에러 해결
code-server를 이용해서 vsocde ide를 서버에 dockerfile을 만들고 띄우는 작업을 하는 도중 jupyter extension을 사용할 때 로딩만 계속되고 나오지 않는 현상이 나왔다.https://github.com/coder/code-server (아래 처럼 계속 로딩 중) 그래서 콘솔을 확인해 보니 다음과 같은 ERROR가 나오는 것을 확인했다. 와 는 가렸습니다 ERR 'crypto.subtle' is not available so webviews will not work. This is likely because the editor is not running in a secure context (https://developer.mozilla.org/en-US/docs/Web/S..
2024.11.09 -
N8N) 웹 크롤링 기반 자동 분석 및 결과 전송 워크플로우
n8n이란? n8n은 오픈 소스 자동화 툴로, 다양한 서비스와 API를 연결하여 업무 프로세스를 자동화할 수 있습니다. 사용자는 n8n을 통해 여러 작업을 시각적으로 연결하여 복잡한 워크플로우를 쉽게 만들 수 있으며, 이를 통해 효율적으로 반복적인 작업을 자동화할 수 있습니다. 이 워크플로우는 웹사이트에서 데이터를 크롤링하고, 크롤링된 텍스트를 전처리한 후 GPT를 활용해 자연어 처리 및 요약을 수행하는 과정으로 시작됩니다. 이후, 파이썬을 사용해 텍스트를 분석하여 추가적인 인사이트를 도출하고, 최종 결과를 지메일을 통해 자동으로 전달합니다. 이 과정을 통해 크롤링부터 분석, 결과 전송까지의 전 과정을 자동화함으로써 사용자의 시간과 노력을 절감하는 데 중점을 두고 있습니다.주요 단계:웹사이트 크롤링: 필..
2024.10.19