LLM이 뭐야?: 대형 언어 모델 5분 이해
ChatGPT에 처음 접속했을 때 “이게 어떻게 이렇게 말이 되지?”라는 생각이 드는 사람이 꽤 있다. 그 뒤에 있는 기술이 바로 LLM이다.

LLM 한 줄 정의
**LLM(Large Language Model, 대형 언어 모델)**은 방대한 텍스트를 학습해 글을 이해하고 생성하는 AI 프로그램이다.
풀어서 말하면 이렇다. 인터넷에 있는 수십억 개의 문장을 읽고 “이 다음에 어떤 단어가 오면 자연스러운가”를 반복 학습한 결과물이다. 지금 우리가 매일 쓰는 ChatGPT, Claude, Gemini가 모두 이 기술 위에서 돌아간다.
“Large(대형)“라는 단어가 붙는 이유도 단순하다. 학습에 쓰인 텍스트 양이 엄청나게 많고, 모델 내부의 숫자(파라미터) 개수도 수천억 개 단위이기 때문이다.
중학생도 이해하는 비유
LLM을 이해하는 가장 빠른 방법은 이 비유다.
“전 세계 도서관의 책을 전부 읽은 학생” 이라고 생각하면 된다.
그 학생은 책을 수십억 권 읽었으니 문장을 유창하게 쓰고, 어떤 질문에도 그럴듯한 답을 내놓는다. 하지만 직접 경험한 게 아니라 텍스트만 읽은 것이기 때문에, 가끔 기억을 혼동해 틀린 말을 자신 있게 하기도 한다. 이걸 할루시네이션(hallucination, 환각) 이라고 부른다.
한 가지 더. 이 학생은 책에서 배운 것만 안다. 책 밖에서 일어난 일, 예를 들어 학습 데이터 수집 이후 발생한 최신 사건은 모른다. 그래서 LLM에게 “오늘 뉴스”를 물으면 엉뚱한 답이 나오는 경우가 있다.
실제 사용 예시
LLM은 이미 일상 여러 곳에서 쓰이고 있다.
예시 1: 챗봇 대화 ChatGPT나 Claude에게 “이 계약서 요약해줘”라고 입력하면 LLM이 문서를 읽고 핵심을 뽑아 준다. 긴 문서를 다루다 보면 무료 플랜은 처리 가능한 텍스트 범위(컨텍스트 윈도우)에 금방 닿는 느낌이 든다. 그 한계를 넘으면 앞 내용을 잊어버린다.
예시 2: AI 코딩 도구 Cursor, Copilot 같은 AI 코딩 도구도 LLM을 사용한다. 코드 문맥을 읽고 다음 줄을 제안하거나 오류를 분석해 수정 방법을 알려준다. 코딩을 모르던 사람도 LLM 기반 도구 덕분에 간단한 스크립트를 직접 짜는 경우가 늘고 있다.
예시 3: 문서 작성 보조 이메일을 “공손하게 다시 써줘”라고 요청하거나, 회의 내용을 붙여 넣고 “3줄 요약해줘”라고 하는 것 모두 LLM이 하는 일이다. 문서 초안 잡는 시간이 눈에 띄게 줄어드는 걸 쓰다 보면 자연스럽게 체감하게 된다.
비슷한 용어와 차이
헷갈리기 쉬운 개념을 한 번에 정리했다.
| 용어 | 뜻 | LLM과의 관계 |
|---|---|---|
| AI(인공지능) | 사람처럼 생각·판단하는 기술 전체 | AI의 하위 분야 중 하나 |
| 챗봇 | 대화 인터페이스를 가진 서비스 | LLM을 이용해 만든 서비스 |
| GPT | OpenAI가 만든 LLM 모델명 | LLM의 한 종류 |
| Claude | Anthropic이 만든 LLM 모델명 | LLM의 한 종류 |
| SLM | 소형 언어 모델 | LLM보다 작고 빠름, 온디바이스 AI에 활용 |
따라서 “ChatGPT = LLM”이 아니다. 정확하게는 “ChatGPT는 GPT라는 LLM을 사용해 만든 챗봇 서비스”다. 이 구분을 알면 AI 뉴스가 훨씬 빨리 읽힌다.
AI·LLM·챗봇 세 용어의 관계가 아직 헷갈린다면 AI 뜻·LLM 이란·챗봇 차이 완벽 정리, 2026년 기준에서 더 자세히 확인할 수 있다.
언제 LLM을 마주치나
LLM이라는 단어는 보통 이런 상황에서 등장한다.
- 뉴스·유튜브: “구글이 새 LLM 공개”, “오픈AI 최신 LLM 성능 비교”처럼 AI 모델을 소개할 때
- 서비스 요금제 설명: “이 플랜에서는 더 강력한 LLM에 접근 가능”처럼 모델 등급을 설명할 때
- 개발자 문서: API를 연결하거나 AI 기능을 직접 개발할 때 어떤 LLM을 사용할지 선택하는 상황
- AI 도구 비교: ChatGPT vs Claude vs Gemini처럼 여러 LLM의 성능과 가격을 비교할 때
AI 뉴스를 자주 접하다 보면 LLM이라는 단어가 반복해서 나온다. “이게 그냥 AI 언어 모델이구나”라고 이해하고 넘어가면 된다.
관련 용어
LLM을 이해했다면 이 네 용어를 함께 알아두면 흐름이 연결된다.
- 토큰(token): LLM이 텍스트를 처리하는 기본 단위. 단어보다 더 작게 쪼갠 조각이다. 많은 서비스가 토큰 수를 기준으로 사용량을 계산한다.
- 파라미터(parameter): LLM이 학습하면서 만들어지는 내부 수치. 숫자가 클수록 더 복잡한 패턴을 학습할 수 있다.
- 컨텍스트 윈도우(context window): LLM이 한 번에 처리할 수 있는 텍스트의 최대 범위. 이 범위를 넘으면 앞 내용을 기억하지 못한다.
- 할루시네이션(hallucination): LLM이 사실처럼 보이지만 틀린 정보를 생성하는 현상. AI 할루시네이션(환각) 뜻과 예방법 완벽 정리 2026에서 자세한 내용을 확인할 수 있다.
LLM은 “방대한 텍스트를 학습해 글을 이해하고 생성하는 AI 프로그램”이다. ChatGPT, Claude, Gemini를 쓰고 있다면 이미 LLM을 매일 쓰고 있는 것이다. 이 개념 하나를 알면 AI 관련 뉴스와 서비스 설명이 훨씬 빨리 읽힌다.
출처
- OpenAI, GPT 모델 소개 페이지, https://openai.com/research/
- Anthropic, Claude 모델 소개 페이지, https://www.anthropic.com/claude
- Google DeepMind, Gemini 모델 소개 페이지, https://deepmind.google/technologies/gemini/