記事を検索

ビジネスIT用語

資料一覧

導入事例

ビジネスメールマガジン

ビジネス
メールマガジン

LLM (大規模言語モデル) とは？
仕組みや種類、生成AIとの違いを解説

2025 4/18

AIの進化が加速する昨今において、特に注目を集めているのがLLM (大規模言語モデル) です。LLMは、ChatGPTをはじめとする対話型AIの基盤となる技術で、文章作成、校正、リアルタイム翻訳、カスタマーサポートといった多様なシーンでの活用が進んでいます。本記事では、LLMの仕組みや種類、生成AIとの違いについて詳しく解説し、実際の用途や活用例もわかりやすく紹介します。

LLM (大規模言語モデル) とは
LLMの仕組み
生成AI・ChatGPTとの違い
種類
用途や活用例
歴史
課題
まとめ

目次	LLM (大規模言語モデル) とは LLMの仕組み LLMと生成AI・ChatGPTとの違い LLMの種類 LLMの用途や活用例 LLMの歴史 LLMの課題まとめ

1．LLM (大規模言語モデル) とは

LLMはLarge Language Modelsの略で、大量のデータとディープラーニング (深層学習) 技術で構築された言語モデルを指します。従来の言語モデルに比べて、処理するデータ量や計算量が格段に増えているのが特長です。
また、言葉の予測や生成に使われるパラメータ (計算の基になる数値) の数も飛躍的に増加しています。これらの要因から、人間により近い自然な会話や高精度な処理が実現可能になりました。

2． LLMの仕組み

LLMは、事前学習 (Pre-Training) と微調整 (Fine-Tuning) という2段階のプロセスを経て構築されています。
その後の基本的な処理の流れは以下のとおりです。

1. トークン化	→	2. 文脈理解	→	3. エンコード	→
入力文を単語、サブワード、または文字などのトークン (最小単位) に分解	→	数値データに変換し、プロンプト内の各トークン間の関連性を計算	→	各単語の特徴量を抽出	→

4. デコード	→	5. 確率出力
エンコードされたデータを基に、次のトークンを予測	→	入力文の次のトークンの確率を出力

LLMのモデルによって細かな流れは異なりますが、基本的には以上の手順を繰り返して文書生成が実行されます。事前に大量のデータを学習し、得られた知識を基に、次に続くトークンの出現確率を計算し、最も適切な言葉や文章を生成する仕組みです。

青い背景に浮かぶデジタルな歯車のイラスト。歯車からデータが放出されている様子が描かれている。

3．LLMと生成AI・ChatGPTとの違い

ここでは、LLMと生成AI・ChatGPTとの違いについて解説します。

3-1. 生成AIとの違いは

生成AIは、テキスト、画像、音声、動画など、さまざまな種類のコンテンツを自動で生成する技術を指します。一方、LLMは、生成AIの一種であり、特に自然言語の理解と生成に特化したモデルです。
つまり、生成AIは幅広いメディアコンテンツを生成できる包括的な技術であり、LLMはその中でもテキスト処理に焦点を当てたモデルといえます。

3-2. ChatGPTとの違いは

ChatGPT (Chat Generative Pre-trained Transformer) は、アメリカのOpenAIが開発・提供する対話型AIです。ビジネスから日常生活まで、幅広い分野で革新的なサービスとして注目を集めています。このChatGPTの基盤となっているのがLLMという技術です。ChatGPTはLLMを活用したサービスの一例であり、製品と技術という関係性に当たります。LLMはAIサービス構築において不可欠な要素です。

4.　LLMの種類

LLMの種類は、大きく以下の3つです。それぞれの特徴をみていきましょう。

4-1. OpenAI o1 (オーワン)

OpenAI o1 (注1) は、2024年9月にOpenAI社が発表したLLMです。o1には思考プロセスが導入されており、科学的分析やプログラミングなどの複雑な問題解決に強みを持っています。さらに 2024年12月には、より深い思考と高精度な回答を行うo1 pro modeと呼ばれるモデルも提供が開始されました。同月には、次世代モデルo3 (注2) がOpenAI社から発表され、2025年4月には本格版とo4-mini (注3) がリリースされました。なお、コンパクトな推論モデルであるo3-miniとo3-mini high (注4) は2025年1月より提供されています。

4-2. Llamaシリーズ

Llamaシリーズは、Meta社が開発したLLMです。2023年7月に発表されたLlama 2 (注5) では70億、130億、700億パラメータの3種類を用意し、事前学習版とチャット特化版を公開しました。さらに、2024年9月のLlama3.2 (注6) では、モバイル利用向けの軽量テキストモデル (1B、3B) と、画像理解に優れたビジョンモデル (11B、90B) が加わっています。軽量テキストモデルは少ない計算リソースでの多言語対応を実現し、ビジョンモデルはベンチマークで優れた数値を記録しているのが特長です。

4-3. Gemini (ジェミニ) 2.0 Flash Thinking

Gemini 2.0 Flash Thinking (注7) は、2024年12月に Google がリリースした新しいLLMです。同月発表の Gemini 2.0 Flash の派生モデルであり、回答時に思考過程を生成することで、より高度な推論が可能となっています。ベースとなる Gemini 2.0 Flash は、先代モデルの2倍の処理速度と高い精度を誇っており、特にコーディングや数学的問題解決に強みを持っているのが特長です。最新モデルは Google AI Studio と Gemini API で試験運用版として提供され、テキストと画像入力に対応しています。

注1) 参考：OpenAI「Learning to reason with LLMs」(外部サイトへ遷移します)
注2) 参考：OpenAI「OpenAI o3 and o3-mini—12 Days of OpenAI: Day 12」(外部サイトへ遷移します)
注3) 参考：OpenAI「OpenAI o3 and 04-mini」(外部サイトへ遷移します)
注4) 参考：OpenAI「OpenAI o3-mini」(外部サイトへ遷移します)
注5) 参考：Meta「Llama 2: Open Foundation and Fine-Tuned Chat Models」(外部サイトへ遷移します)
注6) 参考：Meta「Llama 3.2: Revolutionizing edge AI and vision with open, customizable models」(外部サイトへ遷移します)
注7) 参考：Google「Gemini 2.0 is now available to everyone」(外部サイトへ遷移します)

5．LLMの用途や活用例

LLMの強みは自然な文章理解と生成能力です。すでに以下のような幅広い分野で活用されています。

コミュニケーション支援

カスタマーサポート
デジタル上でのユーザーとの対話

文章処理

文章の作成と校正
文章の要約
議事録作成と内容抽出
マーケティング用の広告テキスト作成

言語処理

リアルタイム翻訳
文章の分類と言い換え
キーワードの抽出

IT・技術支援

プログラムのバグチェック
情報検索
意味解釈の補助

これらの活用分野のうち、ビジネス現場における具体的な活用例をみていきましょう。

2人の女性がコンピュータ画面を見ながら笑顔で話している。画面にはデジタルデータやグラフが表示されている。

5-1. コンタクトセンター業務特化型LLMアプリの開発

KDDIはアルティウスリンク、ELYZAとの3社で、コンタクトセンター業務特化型LLMアプリケーションを開発しました。2024年9月から「Altius ONE for Support」として提供を開始し、業務効率化とサービス品質向上を実現しています。

KDDI、アルティウスリンク、ELYZA、コンタクトセンター特化型LLMアプリを開発

※ 外部サイトへ遷移します。

5-2. 「アフターコールワーク」の自動化

また、ELYZAと明治安田生命保険相互会社では、電話対応後の「アフターコールワーク」を自動化しました。日本語特化型LLMによる応対メモの自動作成により、年間約55万件の作業時間を約30%削減できる見込みです。

KDDIとELYZAの提携で進む―日本語特化LLM開発と生成AIの社会実装

6．LLMの歴史

LLMは古くから研究が進められてきた技術です。ここでは、LLMの歴史を簡単に紹介します。

1940年代-1980年代	1940年代から1980年代は、現代のLLMにつながる基礎理論が確立された時代です。1943年にニューラルネットワークに関する最初の科学論文が発表され、その後、1989年にはヤン・ルカンによって誤差逆伝播ニューラルネットワークの画像認識への応用可能性が示されました。
2012年	2012年に発表されたヒントンらの研究では、深層ニューラルネットワーク (DNN) が音声認識において従来の手法を大幅に上回る性能を示しました。
2017-2018年	2017〜2018年になり、現代のLLMの基礎が構築されます。2017年のトランスフォーマーアーキテクチャの登場と、2018年の Google によるBERT導入など、重要な技術革新が相次ぎました。
2020-2022年	2020年にOpenAI社がGPT-3をリリースし、2022年にはChatGPTが一般公開されました。2020〜2022年にかけて、LLMと生成AIが社会に広く認知されるようになります。
2023年-現在	2023年、LlaMA 2やGPT-4といった新たなLLMの登場により、オープンソースモデルが台頭し、性能も大きく向上しました。現在、LLMは多様化と高性能化の一途をたどっています。(注8)

注8) 参照元：databricks「大規模言語モデル (LLM) の歴史」(外部サイトへ遷移します)

7．LLMの課題

現時点でLLMにはいくつかの課題があります。

一つが「ハルシネーション」です。ハルシネーションとは、AIが誤った情報や無関係な内容を事実のように出力する現象を指します。そのため、LLMの出力情報は、複数の情報源で検証することが不可欠です。セキュリティ面では、不正なプロンプトによる「プロンプトインジェクション」対策が重要な課題となっています。機密情報の漏えいといったリスクを回避すべく、類似プロンプトのブロックやフィルターを用いた入力制限を含む、防御体制の構築が必要です。

また、LLMの開発・運用面での課題も看過できません。LLMの作成には膨大なテキストデータと高性能な機器を要し、環境整備に多大な初期コストがかかります。そのため、資金力のある一部の大企業による独占が懸念されているのが現状です。

8．まとめ

LLMは、カスタマーサポートや文章作成、リアルタイム翻訳、情報検索など、ビジネスのさまざまな場面で活用されています。

LLMを適切に運用すれば、業務効率化やサービスの品質向上につながるでしょう。今後のAI技術の発展により、LLMはさらなる活用範囲の拡大が期待されています。効果的に活用するためには、各企業の業務内容や目的に合わせたLLMを導入することが重要です。

生成AIの活用をご検討中の方はKDDIへ

LLMを活用した生成AIサービスの導入には、セキュリティ対策を含めた運用方針の策定が必要不可欠です。KDDIでは、生成AI導入時のコンサルティングから設計、構築までトータルでサポートいたします。生成AIによる業務効率化や課題解決を実現するためのご支援が可能です。

生成AIの活用をご検討している方は、お気軽にお問い合わせください。

生成AI

KDDI 法人・ビジネス向け「生成AI」サービスのご案内です。
生成AIに関連する各種サービスでお客さまのビジネスをサポートします。

LLM (大規模言語モデル) とは？
仕組みや種類、生成AIとの違いを解説

目次

1．LLM (大規模言語モデル) とは

2． LLMの仕組み