전체 글 22

Gemma 3 Technical Report 논문 리뷰

2025년 03월 Google DeepMind에서 오픈소스 AI 모델 시리즈인 Gemma 3를 공개했습니다. Gemma3는 이미지 이해, 다국어 지원, 최대 128K 토큰까지 긴 문맥 이해 능력이 추가되었습니다. 이번 포스팅에서는 Gemma 3 Technical Report 읽고 정리한 내용을 공유드리도록 하겠습니다.논문 정보제목: Gemma 3 Technical Report저자: Gemma Team, Google DeepMind발행일: 2025년 3월 12일링크: https://arxiv.org/abs/2503.19786요약Gemma 3는 1B, 4B, 12B, 27B 파라미터로 다양하게 제공되며, 휴대폰, 노트북, GPU에서도 실행할 수 있도록 최적화되어 있습니다. 또한, 이미지 이해, 다국어 이해,..

Papers 2025.09.10

LLM JSON 출력 안정화: JSON Mode·Function Calling·Structured Output 정리

LLM을 활용해 구조화된 JSON 형식을 출력할 때, 출력 형식이 깨져 파싱이 실패하는 경우가 종종 발생합니다. 이뿐만 아니라, 코드 블록으로 나오는 경우나 코드 블록 없이 나오는 경우도 있어서 이를 위한 처리 과정이 필요하기도 합니다. 서비스에서 LLM이 지정한 JSON 형식으로 답변을 생성하지 않아 오류가 발생하면 서비스에 지장이 생기기 때문에 반드시 해결해야 하는 문제였습니다. 당시에 openai 모델과 자사 모델을 모두 사용했었는데, 자사 모델의 경우에는 학습 데이터를 구축해서 학습시키기도 했습니다. 하지만 100% 완벽하진 않았습니다. 이를 해결하기 위해서 시도했던 방법과 openai api 이용자의 경우 사용할 수 있는 기능을 소개해드리도록 하겠습니다. 1~3번은 어떤 LLM이든 공통적으로 적..

Development 2025.09.08