エス・アンド・アイ
株式会社

コンタクトセンターDX最前線

もっともらしい嘘を制御できるか？生成AIナレッジ検索を活用するためのコツを技術的観点で解説

作成日: 2024年11月05日｜更新日: 2025年03月07日

コンタクトセンターの現場では、応対履歴やFAQなどの形式知として活用できるデータが充実しているため、生成AIの技術を活用して業務効率化やサービス品質の向上につなげようとする動きが活発になっています。

今回は、質問内容から適切な応対プランを提案することで、オペレーターの業務支援にも活用できる生成AIを活用したナレッジ検索をテーマに、その仕組みや特徴と、生成AIがつく嘘をどう回避するべきか、技術の観点からご紹介します。

生成AIを活用したナレッジ検索とは？従来のAIナレッジ検索との違い

従来のAIナレッジ検索は、FAQやマニュアルなどのナレッジベースに存在する情報をもとにAIが質問文の意図を理解・学習し、「回答候補を導き出す」仕組みが主流でした。質問文の意図を理解して、関連する回答候補を関連性の高い順に一覧で表示しますが、基本的には事前に登録されている情報の提示です。未知の質問には対応できませんでした。また、回答精度を維持するためには、継続的な学習が不可欠です。

一方、生成AIを活用したナレッジ検索では、FAQやマニュアル、過去の応対履歴など膨大な情報から「回答を直接生成する」ことができます。従来と比較して大きく進化した点は、未知の質問に対してもLLMが持ち得る知識データの中から回答を生成できる点です。

■ 従来のAIナレッジ検索と生成AIナレッジ検索の違い

	従来のAIナレッジ検索	生成AIナレッジ検索
検索方法/回答の提示	キーワードベースの検索で、関連する情報（一致するFAQやドキュメント）を一覧で提示	文脈を理解し、最適な回答を直接生成
質問の柔軟性	事前に登録されたキーワードや定型文が必要	自然な会話形式でも質問可能
質問の理解	キーワードの一致が中心（意図の深い理解は難しい）	質問の意図を理解し、関連情報を組み合わせて回答
回答の生成	事前に登録した情報のみ提示	複数の情報から最適な回答を生成。未知の質問にも回答できる。

スクロールできます

従来のAIナレッジ検索はが回答リストを提示してくれるツールだったのに対し、生成AIナレッジ検索は、膨大な情報から必要な情報をまとめて回答を作り出してくれるため、検索の手間を減らせる、すぐに情報が得られる、FAQにない高度な質問にも対応してくれるという特長があります。

生成AIナレッジ検索における最大の課題「もっともらしい嘘（ハルシネーション）」

従来のAIナレッジ検索に比べて、利便性が飛躍的に向上した生成AIナレッジ検索ですが、「生成AIが回答を生成する」という特性上、その回答が本当に正しいのか、嘘が含まれていても気づけない可能性があります。

簡単な例を使って、生成AIが生成した回答の精度を見てみましょう。

一見どちらも正しい回答のように見えますが、これは、2024年のノーベル賞受賞者が発表される前の2024年9月2週目頃に生成AIに質問した結果です。

後者の「2024年のノーベル文学賞を受賞した作家は誰ですか？」という質問に対して、まだ2024年のノーベル文学賞の受賞者は発表されていないにも関わらず、生成AIは「ノルウェーの作家ジョン・フォッセに授与された」と、あたかも本当の情報のように回答しています。これが生成AIがつく嘘「ハルシネーション」です。

[2024年9月 ChatGPT-4oを使用]

生成AIは、ハルシネーションと呼ばれる正しそうな嘘を生成してしまうリスクも多くあり、生成AIに正しい回答だけをさせることは、現段階では技術的にもかなり難しいと言われています。

例えば、ChatGPT-4oは2024年11月現在、2023年10月までのインターネット上の情報しか知らないため、新しい時事は分かりません。それでも、あたかも本当のように嘘の情報を提供してきます。そのため、あくまでも最後は人が判断することが推奨されています。

このように、生成AIがつく嘘をどう制御するかが、生成AIナレッジ検索を業務で活用するための鍵と言えるのですが、実際の現場では利用するユーザーの経験や知識も異なるため、生成AIが作り出した回答に嘘が含まれているのか、判断が難しいケースも十分に考えられます。そこで重要になるのが、次で紹介する「RAG（Retrieval-augmented generation）」という技術です。

RAGでナレッジ検索の精度UP！ハルシネーションを防ぐための仕組み

ハルシネーションを抑制する仕組みとして、RAG（Retrieval-augmented generation）の技術を駆使して抽出されたデータからさらに活用しやすい文章に変換する方法が最近では主流になっています。

RAGはLLMによるテキスト生成に外部情報の検索を組み合わせることで、回答精度を高める技術です。ナレッジ検索においても、事前処理で形態素解析などを使って関連性の高い情報を検索した後、それらの情報から回答をまとめることで、ハルシネーションを抑えることが可能になります。

ハルシネーションを抑制するためのRAGを使った仕組み

以下の例では、「2024年のノーベル文学賞を受賞した作家は誰ですか？」という質問と共に、先に検索技術を使って得た情報（回答の元ネタになる情報サイトのURLと、過去の受賞者一覧）を付け加えて生成AIに質問しています。このように、回答元になる情報を明示的に指定することで、生成AIは「現在のところ受賞者は未発表です」という正しい回答を返せるようになります。

このように、生成AIナレッジ検索で正しい回答を得るためには、生成AIにインプットする前の「検索」が重要になります。ここで、生成AIにインプットうする前に活用できる代表的な検索技術をいくつかご紹介します。

■ RAGとともに活用される主な検索の技術

WDS（Whole Document Search、全体文書検索）

・文書全体を対象とした検索技術
・一般的なキーワード検索では単語の有無にしか焦点を当てられないが、WDSは文書全体の流れや意図を把握することで、単語の一致だけでなく、文脈や関係性も考慮した高度な検索が可能になる

ベクトル検索

・単語や文章などのデータを数値ベクトルに変換し、その意味や関係性を数学的に表現する技術
・ベクトル間の類似度を評価することで、ベクトル空間上で近い位置にあるデータ同士が類似していると判断され、関連性の高いデータを検索する
・一般的なキーワード検索よりも関連性の高いデータを効率的/精度よく検索できる

TF-IDF（Term Frequency-Inverse Document Frequency）

・文章内の単語の重要度を評価する技術
・特定の単語が文書全体にどれだけ頻繁に登場するか（TF）と、その単語が全体の文書群にどれだけ出現しているか（IDF）を組み合わせ、各単語の重要性を算出し、文書内で特に意味がある単語を把握することができる

形態素解析（Morphological Analysis）

・自然言語を構成する最小の意味単位（形態素）に文章を分解し、単位ごとの意味や役割を解析する技術
・日本語のように明確な単語の区切りがない言語では形態素解析が不可欠。文中の単語の品詞や意味を理解し、文の構造を把握することが可能になり、適切な処理を行えるようになる

BERT（Bidirectional Encoder Representations from Transformers）

・文脈を理解する自然言語処理技術
・従来の単方向モデルと異なり、文の前後関係を同時に考慮しながら、文章全体の意味を把握することで、より正確でコンテキストに基づいた検索や回答生成することが可能になる

Attention Mechanism（アテンション機構）

・長い文章やデータセットの中で、どの部分に注目すべきかを特定する技術
・従来のニューラルネットワークは文章全体を均等に処理していたのに対し、特定の単語やフレーズに重みをつけ、文脈中の重要な要素に焦点を当てることが可能になる

いずれの検索技術を使うかは、以下の観点で検討する必要があります。

・ユースケース、検索の目的（完全一致、類似性、意味理解など）
・求められる精度
・応答時間の要件
・技術的制約
・データ量
・計算リソース
・メンテナンスコスト
・運用面
・更新頻度
・スケーラビリティ要件
・コスト制約

これらの要素をさまざまな角度から多角的に評価し、それぞれの技術の利点と弱点を理解した上で選択することで、ニーズに最も適した生成AIナレッジ検索システムを構築できるようになります。そして、よりハルシネーションを抑制可能なサービスを目指せるでしょう。

まとめ

生成AIナレッジ検索を最大限活用しようとする場合、ハルシネーションの制御が重要なポイントになります。

RAGの技術を使って自社内のFAQ等のデータを前提とした回答を生成させたり、勘違いされるような意図を排除させたりすることで、AIが正しい回答を生成できるようになり、オペレーターの経験やスキルによらない案内が可能になるでしょう。

S&Iでは、こうした生成AIの特性も踏まえて、コンタクトセンターの応対業務での活用を積極的に支援しています。生成AIとやり取りするデータの加工や処理、セキュリティ対策を考慮したサービス設計など、お客さまの業務や運用フローに応じたご提案が可能です。ご興味のある方は、ぜひ、S&Iまでご相談ください。

問い合わせる

もっともらしい嘘を制御できるか？生成AIナレッジ検索を活用するためのコツを技術的観点で解説

生成AIを活用したナレッジ検索とは？従来のAIナレッジ検索との違い

■ 従来のAIナレッジ検索と生成AIナレッジ検索の違い

生成AIナレッジ検索における最大の課題「もっともらしい嘘（ハルシネーション）」

RAGでナレッジ検索の精度UP！ハルシネーションを防ぐための仕組み

■ RAGとともに活用される主な検索の技術

まとめ

コンタクトセンターDX最前線

新着コラム

クラウドコンタクトセンター導入失敗、共通する5つの落とし穴とは？

LLMは用途に応じて選んで使う時代に突入！AIとデータのためのプラットフォームIBM watsonxとは？

無料で使える機能も？！顧客体験価値を高めるGenesys CloudのAI機能とは？

もっともらしい嘘を制御できるか？生成AIナレッジ検索を活用するためのコツを技術的観点で解説

生成AIを活用したナレッジ検索とは？従来のAIナレッジ検索との違い

■ 従来のAIナレッジ検索と生成AIナレッジ検索の違い

生成AIナレッジ検索における最大の課題「もっともらしい嘘（ハルシネーション）」

RAGでナレッジ検索の精度UP！ハルシネーションを防ぐための仕組み

■ RAGとともに活用される主な検索の技術

まとめ

コンタクトセンターDX最前線

新着コラム

クラウドコンタクトセンター導入失敗、共通する5つの落とし穴とは？

LLMは用途に応じて選んで使う時代に突入！AIとデータのためのプラットフォームIBM watsonxとは？

無料で使える機能も？！顧客体験価値を高めるGenesys CloudのAI機能とは？

関連コラム

LLMは用途に応じて選んで使う時代に突入！AIとデータのためのプラットフォームIBM watsonxとは？

顧客の真のニーズ把握に欠かせない！生成AIの精度アップの鍵「ファインチューニング」と「RAG」の世界

まるでベテランオペレーターが傍でサポートしてくれている？RAGとフューショット学習の世界