このページはJavaScriptを使用しています。JavaScriptを有効にして、または対応ブラウザでご覧下さい。

閉じる
閉じる
LLM (大規模言語モデル) とは?仕組みや種類、生成AIとの違いを解説

LLM (大規模言語モデル) とは?
仕組みや種類、生成AIとの違いを解説

2025 4/18
AIの進化が加速する昨今において、特に注目を集めているのがLLM (大規模言語モデル) です。LLMは、ChatGPTをはじめとする対話型AIの基盤となる技術で、文章作成、校正、リアルタイム翻訳、カスタマーサポートといった多様なシーンでの活用が進んでいます。本記事では、LLMの仕組みや種類、生成AIとの違いについて詳しく解説し、実際の用途や活用例もわかりやすく紹介します。

1.LLM (大規模言語モデル) とは

LLMはLarge Language Modelsの略で、大量データディープラーニング (深層学習) 技術構築された言語モデルを指します。従来言語モデルに比べて、処理するデータ量や計算量格段に増えているのが特長です。
また、言葉予測生成に使われるパラメータ (計算の基になる数値) の数も飛躍的増加しています。これらの要因から、人間により近い自然会話高精度処理実現可能になりました。

関連サービス: AI

2. LLMの仕組み

LLMは、事前学習 (Pre-Training) と微調整 (Fine-Tuning) という2段階プロセスを経て構築されています。
その後の基本的処理の流れは以下のとおりです。

1. トークン化 2. 文脈理解 3. エンコード
入力文を単語、サブワード、または文字などのトークン (最小単位) に分解 数値データに変換し、プロンプト内の各トークン間の関連性を計算 各単語の特徴量を抽出
4. デコード 5. 確率出力
エンコードされたデータを基に、次のトークンを予測 入力文の次のトークンの確率を出力

LLMのモデルによって細かな流れは異なりますが、基本的には以上手順を繰り返して文書生成実行されます。事前大量データ学習し、得られた知識を基に、次に続くトークン出現確率計算し、最も適切言葉文章生成する仕組みです。

青い背景に浮かぶデジタルな歯車のイラスト。歯車からデータが放出されている様子が描かれている。

3.LLMと生成AI・ChatGPTとの違い

ここでは、LLMと生成AI・ChatGPTとの違いについて解説します。


3-1. 生成AIとの違いは

生成AIは、テキスト画像音声動画など、さまざまな種類コンテンツ自動生成する技術を指します。一方、LLMは、生成AIの一種であり、特に自然言語理解生成特化したモデルです。
つまり、生成AIは幅広メディアコンテンツ生成できる包括的技術であり、LLMはその中でもテキスト処理焦点を当てたモデルといえます。


3-2. ChatGPTとの違いは

ChatGPT (Chat Generative Pre-trained Transformer) は、アメリカのOpenAIが開発提供する対話型AIです。ビジネスから日常生活まで、幅広分野革新的サービスとして注目を集めています。このChatGPTの基盤となっているのがLLMという技術です。ChatGPTはLLMを活用したサービス一例であり、製品技術という関係性に当たります。LLMはAIサービス構築において不可欠要素です。

4. LLMの種類

LLMの種類は、大きく以下の3つです。それぞれの特徴をみていきましょう。

関連サービス: Azure OpenAI Service

関連サービス: Gemini


4-1. OpenAI o1 (オーワン)

OpenAI o1 (注1) は、2024年9月にOpenAI社が発表したLLMです。o1には思考プロセス導入されており、科学的分析プログラミングなどの複雑問題解決に強みを持っています。さらに 2024年12月には 、より深い思考高精度回答を行うo1 pro modeと呼ばれるモデル提供開始されました。 同月には、次世代モデルo3 (注2) がOpenAI社から発表され、2025年4月には本格版とo4-mini (注3) がリリースされました。なお、コンパクト推論モデルであるo3-miniとo3-mini high (注4) は2025年1月より提供されています。


4-2. Llamaシリーズ

Llamaシリーズは、Meta社が開発したLLMです。2023年7月に発表されたLlama 2 (注5) では70億、130億、700億パラメータの3種類用意し、事前学習版チャット特化版公開しました。さらに、2024年9月のLlama3.2 (注6) では、モバイル利用向けの軽量テキストモデル (1B、3B) と、画像理解に優れたビジョンモデル (11B、90B) が加わっています。軽量テキストモデルは少ない計算リソースでの多言語対応実現し、ビジョンモデルベンチマークで優れた数値記録しているのが特長です。


4-3. Gemini (ジェミニ) 2.0 Flash Thinking

Gemini 2.0 Flash Thinking (注7) は、2024年12月に Google がリリースした新しいLLMです。同月発表の Gemini 2.0 Flash の派生モデルであり、回答時思考過程生成することで、より高度推論可能となっています。ベースとなる Gemini 2.0 Flash は、先代モデルの2倍の処理速度と高い精度を誇っており、特にコーディング数学的問題解決に強みを持っているのが特長です。最新モデルは Google AI Studio と Gemini API で試験運用版として提供され、テキスト画像入力対応しています。

5.LLMの用途や活用例

LLMの強みは自然文章理解生成能力です。すでに以下のような幅広分野活用されています。

これらの活用分野のうち、ビジネス現場における具体的活用例をみていきましょう。

2人の女性がコンピュータ画面を見ながら笑顔で話している。画面にはデジタルデータやグラフが表示されている。

5-1. コンタクトセンター業務特化型LLMアプリの開発

KDDIはアルティウスリンク、ELYZAとの3社で、コンタクトセンター業務特化型LLMアプリケーション開発しました。2024年9月から「Altius ONE for Support」として提供開始し、業務効率化サービス品質向上実現しています。

  • ※ 外部サイトへ遷移します。

5-2. 「アフターコールワーク」の自動化

また、ELYZAと明治安田生命保険相互会社では、電話対応後の「アフターコールワーク」を自動化しました。日本語特化型LLMによる応対メモ自動作成により、年間約55万件作業時間を約30%削減できる見込みです。

6.LLMの歴史

LLMは古くから研究が進められてきた技術です。ここでは、LLMの歴史簡単紹介します。

さまざまな日付や曜日が浮かび上がり、数字と文字が光の効果で際立っている。
1940年代-1980年代 1940年代から1980年代は、現代のLLMにつながる基礎理論が確立された時代です。1943年にニューラルネットワークに関する最初の科学論文が発表され、その後、1989年にはヤン・ルカンによって誤差逆伝播ニューラルネットワークの画像認識への応用可能性が示されました。
2012年 2012年に発表されたヒントンらの研究では、深層ニューラルネットワーク (DNN) が音声認識において従来の手法を大幅に上回る性能を示しました。
2017-2018年 2017〜2018年になり、現代のLLMの基礎が構築されます。2017年のトランスフォーマーアーキテクチャの登場と、2018年の Google によるBERT導入など、重要な技術革新が相次ぎました。
2020-2022年 2020年にOpenAI社がGPT-3をリリースし、2022年にはChatGPTが一般公開されました。2020〜2022年にかけて、LLMと生成AIが社会に広く認知されるようになります。
2023年-現在 2023年、LlaMA 2やGPT-4といった新たなLLMの登場により、オープンソースモデルが台頭し、性能も大きく向上しました。現在、LLMは多様化と高性能化の一途をたどっています。(注8)

7.LLMの課題

LLMは強力ツールですが、ビジネス活用する上では、いくつかの重要課題リスク理解し、対策を講じる必要があります。


7-1. ハルシネーション

ハルシネーションとは、AIが事実に基づかない情報文脈にそぐわない内容を、あたかも正しい情報のように生成してしまう現象です。これをそのまま使用すると、誤った意思決定やお客さまへの誤情報提供につながるおそれがあります。

そのため、LLMの出力だけを最終成果物とせず、人によるファクトチェック (事実確認) を業務フローに組み込むことが不可欠です。複数信頼できる情報源との照合専門家レビューなど、確認プロセス明確設計しましょう。


7-2. 著作権・プライバシー侵害のリスク

LLMが学習データに含まれる著作物酷似したコンテンツ生成してしまった場合意図せず著作権侵害する可能性があります。また、ユーザー入力した個人情報や、企業機密情報が、モデル学習利用され、外部に漏えいするリスクゼロではありません。

対策として、LLMの利用規約精査し、入力データ学習利用されない設定 (オプトアウト) を選択できるサービスを選びましょう。また、社内ガイドライン策定し、機密情報個人情報入力しないよう、全従業員周知徹底することも重要です。


7-3. 膨大なコスト (開発・運用・環境)

高性能なLLMをゼロから開発学習させるには、高性能計算機資源膨大電力必要となり、莫大コストがかかります。これにより、開発一部巨大IT企業独占されやすいという経済的課題指摘されています。

多くの企業にとっては、既存のAPIサービス利用する、あるいは用途に合わせてオープンソースモデルカスタマイズしたりするといった選択肢のほうが、コストパフォーマンスバランスが取りやすいと言えるでしょう。

8.まとめ

LLMは、カスタマーサポート文章作成リアルタイム翻訳情報検索など、ビジネスのさまざまな場面活用されています。

LLMを適切運用すれば、業務効率化サービス品質向上につながるでしょう。今後のAI技術発展により、LLMはさらなる活用範囲拡大期待されています。効果的活用するためには、各企業業務内容目的に合わせたLLMを導入することが重要です。

AIの活用をご検討中の方はKDDIへ

LLMを活用したAIサービス導入には、セキュリティ対策を含めた運用方針策定必要不可欠です。KDDIでは、AI導入時コンサルティングから設計構築までトータルサポートいたします。AIによる業務効率化課題解決実現するためのご支援可能です。

AIの活用をご検討している方は、お気軽にお問い合わせください。

関連記事


ピックアップ