LLM

기술노트
Admin (토론 | 기여)님의 2025년 9월 6일 (토) 05:08 판 (Gemini 벌크 업로더로 자동 업로드)
(차이) ← 이전 판 | 최신판 (차이) | 다음 판 → (차이)

📖 LLM (Large Language Model)

LLM 또는 '거대 언어 모델'은 수십억에서 수조 개에 이르는 방대한 양의 텍스트 데이터를 학습하여, 인간의 언어를 이해하고 생성하는 데 특화된 매우 큰 규모의 딥러닝 모델입니다. 인간과 유사한 수준의 자연스러운 대화, 글쓰기, 번역, 요약 등 다양한 자연어 처리(NLP) 작업을 수행할 수 있습니다.

OpenAI의 GPT 시리즈가 LLM의 대표적인 예입니다.


⚙️ LLM의 핵심 기술: 트랜스포머 (Transformer)

LLM의 기반이 되는 아키텍처는 2017년 구글이 발표한 트랜스포머 모델입니다. 트랜스포머는 문장 내 단어들의 관계와 전체적인 맥락을 효과적으로 파악하는 어텐션 메커니즘(Attention Mechanism)을 사용하여, 기존의 RNN 기반 모델들이 가진 장기 의존성 문제를 해결하고 성능을 획기적으로 향상시켰습니다.

특히, 트랜스포머는 병렬 처리가 가능하여 대규모 데이터와 거대한 모델을 효율적으로 학습시킬 수 있었고, 이는 LLM의 등장에 결정적인 역할을 했습니다.


📚 LLM의 학습 방식

LLM은 주로 두 단계에 걸쳐 학습됩니다.

1. 사전 학습 (Pre-training) : 인터넷의 웹 페이지, 책, 기사 등 엄청난 양의 텍스트 데이터를 사용하여, 언어 자체의 일반적인 패턴과 지식을 학습합니다. 이 과정은 비지도 학습 방식으로 이루어지며, 막대한 컴퓨팅 자원을 필요로 합니다. 2. 미세 조정 (Fine-tuning) : 사전 학습된 모델을 특정 목적이나 도메인에 맞는 소규모의 데이터셋으로 추가 학습시켜, 특정 작업(예: 챗봇, 문서 분류)에 대한 성능을 최적화합니다.

이러한 접근 방식을 전이 학습(Transfer Learning)이라고 하며, 모든 것을 처음부터 학습할 필요 없이 효율적으로 고성능 모델을 만들 수 있게 해줍니다.


💡 기술사 핵심 Point

  • LLM은 특정 작업에만 특화된 기존의 AI 모델과 달리, 다양한 NLP 작업을 수행할 수 있는 범용 인공지능(AGI)의 가능성을 보여주었습니다.
  • LLM을 기반으로 한 생성형 AI 서비스(ChatGPT, Bard 등)는 사회 전반에 큰 영향을 미치고 있으며, 이를 활용한 새로운 비즈니스 모델이 계속해서 등장하고 있습니다.
  • LLM은 환각(Hallucination) 현상, 편향성(Bias), 최신 정보 미반영 등의 한계를 가지고 있으며, 이를 기술적으로, 윤리적으로 해결하는 것이 중요한 과제입니다.
  • 프롬프트 엔지니어링(Prompt Engineering)은 LLM이 더 정확하고 유용한 결과를 생성하도록, 효과적인 질문과 지시를 설계하는 기술로 그 중요성이 부각되고 있습니다.