인공 신경망으로 구성된 대규모 언어 모델을 말한다.
OpenAI의 오픈 소스 모델. 2025년 8월 5일에 공개하였다.
파라미터 수에 따라 20b, 120b 모델이 있다.
Hugging Face openai/gpt-oss-20b에 공개하였다.
Ollama로 사용할 수 있다.
ollama pull gpt-oss:20b
ollama run gpt-oss:20b
b20 기준으로도 파인튜닝 하지 않은 모델 그대로 사용해도 한국어 답변을 잘한다. 다른 오픈 모델은 한자나 다른 외국어가 섞여있는 경우가 있었다.
웹 브라우징, 정의된 스키마에 맞춘 함수 호출, 브라우저 작업 같은 에이전트 작업을 잘 한다고 한다.
agno로 function calling을 요청하면 잘 사용한다! 문제는 input context 크기가 작아서 웹페이지의 응답을 처리할 수 없는 점. 많은 모델을 사용하진 않았지만 로컬 모델에서 function calling을 처리하는 모델은 gpt-oss가 처음이다.
Alibaba에서 공개한 영상 생성 오픈 모델이다.
https://huggingface.co/Wan-AI/models?search=wan2.2
파라미터 수에 따라 5b, 14b가 있고 Text-to-Video, Image-to-Vieo, Text-and-Image-to-Video 모델이 있다.
ComfyUI에서 쉽게 사용할 수 있다.
로컬 환경에서 LLM을 사용할 수 있도록 도와주는 도구들이 있다.
GPT-4는 너무 비싸다. 특히 한글은 토큰화하면 영어보다 더 많은 분량이 나온다. 그래서 비용이 더 많이 들고, 더 적은 내용만 API의 입력으로 전달된다.
그래도 공개 LLM보다 ChatGPT 같은 상용 LLM의 품질이 훨씬 좋다. 특히 한글 지원에서 품질 차이가 크게 나타난다.
phidata와 ollama는 'function calling' 기능으로 답변의 품질을 개선한다. AI가 함수 호출을 통해 답변을 생성하는 기능이다.
Phidata는 AI Assistant를 만드는 도구로 function calling 기능을 제공한다.
Ollama는 AI Assistant를 만들거나 모델을 실행하는 도구다. tool-calling 이름으로 function calling 기능을 제공한다.
Spring AI 문서 참조.
Spring Boot는 OpenAI, Ollama 등 AI 플랫폼을 쉽게 연동할 수 있게 해준다. Spring 프레임워크에 익숙하면 좋은 선택으로 보인다.
다만 2024년 7월 1.0.0 SNAPSHOT 단계여서 운영 레벨에서 사용하기에는 무리가 있다.
GitHub에서 공개한 Spec-Driven Development 도구. 스펙을 명세하고 AI 에이전트를 통해서 개발하는 툴킷이다. 즉 바이브 코딩 용.
https://github.com/github/spec-kit
툴킷 자체에서 AI를 지원하는 것이 아니라, gemini cli나 claude code 등 도구에 기능을 추가한다. claude, gemini, copilot 등 다양한 에이전트 도구를 지원한다. copilot은 별도 cli용 챗복 도구가 없기 때문에 VSCode에서 사용해야 한다. 확장성 측면에서 아쉬운 부분.
spec-kit 설정한 후에 cli나 VSCode 채팅 창에서 /specify
, /plan
, /tasks
등 명령어가 추가된다.
이 명령어를 통해서 스펙을 작성하고, 개발 계획을 세우고, 작업을 진행하면 미리 작성된 스펙을 참고하여 에이전트가 코드를 작성한다.
사용해보면 preview 단계에서 종료한 GitHub Copilot Workspace에서 넘어온 것이 아닌가. 진행 흐름이 흡사하다.
가장 먼저 현재 폴더에 프로젝트 설정한다.
uvx
를 사용하므로 uv가 설치되어 있어야 한다.
uvx는 npx와 같이 임시 패키지를 설치하고 실행하는 도구다.
아래 명령어를 입력하면 개발 환경과 사용할 AI 에이전트 도구를 선택한다.
uvx --from git+https://github.com/github/spec-kit.git specify init --here
설정이 완료되면 AI 도구에 /specify
명령어가 추가된다.
이제부터 specify
명령어 대신 AI 도구를 통해 명령어를 사용하는 것으로 진행한다.
/specify
단계
/specify
를 사용하여 개발할 애플리케이션의 사양을 작성한다.
/specify incremental 게임을 구현합니다. 작은 버튼과 골드 보유량을 표시합니다. 버튼을 누르면 골드를 1 증가합니다. 업그레이드 탭이 있습니다. 골드 증가량을 1 증가시키는 업그레이드와 초당 골드 증가 버튼이 있습니다.
/plan
단계
/plan
을 사용하여 기술 스택을 설명하고 개발 계획을 세운다.
/plan 수동 검증, 바닐라 JS, 라이브러리 사용 없음. HTML Canvas를 사용한다.
/tasks
단계
/tasks
를 사용하여 개발할 작업 목록을 생성한다.
여기서는 프롬프트를 따로 입력할 필요는 없고, /tasks
만 입력하면 된다.
개발 단계
이제 명령어가 아닌 일반 대화로 개발을 진행한다.
생성된 tasks.md
파일을 참고하여 생성된 작업 목록을 확인한다.
T001
같은 작업 ID가 부여되어 있어서, "T001부터 작업을 시작해줘" 같은 식으로 작업을 요청할 수 있다.
나는 여기서 playwright-mcp 등으로 브라우저를 띄우고 직접 테스트하도록 자동화 했는데, GPT-5 기준으로 잘 동작했다.