llm 9

Verbalized Sampling: How to Mitigate Mode Collapse and Unlock LLM Diversity 논문 리뷰

본 논문은 2025년 Stanford 대학교에서 발표한 "Verbalized Sampling: How to Mitigate Mode Collapse and Unlock LLM Diversity" 논문 입니다. 한국어로 번역하면 "언어적 샘플링: 모드 붕괴를 완화하고 LLM 다양성을 확보하는 방법" 입니다. 제목에서 알 수 있듯이 LLM 답변의 다양성이 감소되는 문제에 대한 원인과 학습 없이 이를 해결하는 방법에 대한 내용에 담고 있습니다. Paper: https://arxiv.org/abs/2510.01171 Verbalized Sampling: How to Mitigate Mode Collapse and Unlock LLM DiversityPost-training alignment often reduc..

Papers 2026.01.09

LangChain Expression Language(LCEL) 사용 방법 및 예시

LangChain Expression Language(LCEL)은 LangChain에서 여러 컴포넌트(prompt, LLM, 파서, 후처리 함수 등)를 “파이프(pipe)” 형태로 간결하게 연결해 주는 표현 방식입니다. 2023년 하반기부터 LangChain에서 체인(chain) 구성 방식에서 LCEL을 활용하는 경향이 커지고 있습니다. 이번 포스팅에서는 LCEL의 주요 개념과 예제에 대해서 정리해보도록 하겠습니다.주요 개념Runnable: 입력(input)을 받아 출력(output)을 내는 구성 요소RunnableSequence: 여러 Runnable을 직렬(sequence) 로 연결한 것RunnableLambda: 단순한 Python 함수를 Runnable로 감싸서 파이프에서 쓸 수 있게 함Runna..

Development 2025.12.07

LangChain의 주요 컴포넌트 사용 방법 및 예시 - Output Parser

지난 게시글에 이어서 Output Parser에 대해서 정리해보겠습니다. Output Parser는 LLM을 특정 형식으로 출력하도록 할 때, 그 출력을 프로그램적으로 다루고 싶을 때 사용합니다.Output Parser는 JSON 등의 출력 형식을 지정하는 프롬프트 작성과 응답 텍스트의 Python 객체로의 변환 기능을 제공합니다. LangChain에서 제공하는 OutputParser의 종류는 다음과 같습니다.StrOutputParser: 메시지/LLMResult → “가장 그럴듯한 문자열”CommaSeparatedListOutputParser: “a, b, c” → ["a","b","c"]MarkdownListOutputParser: "- 항목1\n- 항목2\n- 항목3" 같은 마크다운 불릿 리스트 텍..

Development 2025.09.24

LangChain의 주요 컴포넌트 사용 방법 및 예시 - LLM/Chat model

지난 게시글에서는 Langchaindml 패키지 그룹과 주요 컴포넌트에 대해서 정리했습니다. 2025.09.08 - [AI] - LangChain의 패키지 그룹과 주요 컴포넌트 정리 LangChain에서 특히 중요한 컴포넌트는 LLM/Chat model, Prompt template, Output parser, Chain, RAG 관련 컴포넌트라고 하였습니다. 이번 글에서는 그중에서도 LLM/Chat model 컴포넌트 사용 방법과 예시에 대해서 정리하도록 하겠습니다. LLM/Chat modelLLM과 Chat model 모두 언어 모델을 LangChain 방식으로 사용할 수 있는 래퍼입니다.LLM은 하나의 텍스트 입력에 대해 하나의 텍스트 출력을 반환하는 형식이고,Chat model은 채팅 형식의 언..

Development 2025.09.20

LangChain의 패키지 그룹과 주요 컴포넌트 정리

LangChain은 LLM(Large Language Model)을 사용하여 애플리케이션을 개발하기 위한 오픈소스 프레임워크입니다.2023년도에 사용해 봤을 때는 크게 필요성을 못 느꼈었는데, 2024년 1월에 v0.1.0으로 업데이트되면서 많이 바뀐 것으로 보입니다. v0.1.0에서는 기존 langchain 패키지에 대한 의존 관계가 너무 많아지는 문제 등을 해결하기 위해 langchain-core, langchain-community 등을 분리하여 아키텍처를 모듈화 하고,LangGraph라는 새로운 라이브러리를 소개하며, 에이전트에 그래프 기반 워크플로우를 도입하게 되었다고 합니다. 따라서, 최근 다시 LangChain을 공부하면서 배운 것을 정리해보고자 합니다. 제가 읽고 있는 책은 "랭체인과 ..

Development 2025.09.18

Attention 안정화 방법 (soft-capping vs. QK-norm)

Transformer 모델의 핵심인 Attention 메커니즘은 모델의 성능에 막대한 영향을 끼칩니다. 하지만 Attention 점수가 지나치게 커지거나 작아지면, gradient 흐름이 불안정해져 모델 학습이 어려워질 수 있습니다. 이런 문제를 해결하기 위한 대표적인 기법으로 최근 QK-Norm(Query-Key Normalization)이 사용되고 있습니다. Gemma 3는 Gemma 2의 soft-capping을 QK-norm으로 대채했다고 하며, Qwen 3에서도 QK-norm을 도입했다고 합니다. Gemma 2에서 사용했던 soft-capping은 무엇이고, Gemma 3와 Qwen 3에서 사용된 QK-norm은 무엇인지 간단하게 정리해보겠습니다.soft-cappingsoft-capping이란 ..

AI 2025.09.16

MHA vs. MQA vs. GQA 비교 정리

Grouped-Query Attention은 2023년 Google Research에서 발표한 기술로, Meta의 LLaMA2, Google의 Gemma에서 사용되었으며, 추론 속도를 빠르게 해주는 기술입니다.GQA와 함께 Multi-Head Attention(MHA), Multi-Query Attention(MQA)에 대해서도 간략하게 정리하려고 합니다.Multi-Head Attention(MHA)Multi-Head Attention(MHA)은 2017년 Attention Is All You Need에서 제안되었습니다.각 attention head는 독립적인 Query, Key, Value를 가지며, 다양한 시각에서 입력 토큰 간 관계를 파악합니다.장점: 풍부한 표현력, 다양한 attention 시각 ..

AI 2025.09.14

Gemma 3 Technical Report 논문 리뷰

2025년 03월 Google DeepMind에서 오픈소스 AI 모델 시리즈인 Gemma 3를 공개했습니다. Gemma3는 이미지 이해, 다국어 지원, 최대 128K 토큰까지 긴 문맥 이해 능력이 추가되었습니다. 이번 포스팅에서는 Gemma 3 Technical Report 읽고 정리한 내용을 공유드리도록 하겠습니다.논문 정보제목: Gemma 3 Technical Report저자: Gemma Team, Google DeepMind발행일: 2025년 3월 12일링크: https://arxiv.org/abs/2503.19786요약Gemma 3는 1B, 4B, 12B, 27B 파라미터로 다양하게 제공되며, 휴대폰, 노트북, GPU에서도 실행할 수 있도록 최적화되어 있습니다. 또한, 이미지 이해, 다국어 이해,..

Papers 2025.09.10

LLM JSON 출력 안정화: JSON Mode·Function Calling·Structured Output 정리

LLM을 활용해 구조화된 JSON 형식을 출력할 때, 출력 형식이 깨져 파싱이 실패하는 경우가 종종 발생합니다. 이뿐만 아니라, 코드 블록으로 나오는 경우나 코드 블록 없이 나오는 경우도 있어서 이를 위한 처리 과정이 필요하기도 합니다. 서비스에서 LLM이 지정한 JSON 형식으로 답변을 생성하지 않아 오류가 발생하면 서비스에 지장이 생기기 때문에 반드시 해결해야 하는 문제였습니다. 당시에 openai 모델과 자사 모델을 모두 사용했었는데, 자사 모델의 경우에는 학습 데이터를 구축해서 학습시키기도 했습니다. 하지만 100% 완벽하진 않았습니다. 이를 해결하기 위해서 시도했던 방법과 openai api 이용자의 경우 사용할 수 있는 기능을 소개해드리도록 하겠습니다. 1~3번은 어떤 LLM이든 공통적으로 적..

Development 2025.09.08