エス・アンド・アイ株式会社
MENU
コラム:Vol.010

認識率100%じゃなくても良い!
AI音声認識技術を活用したサービスとの上手な付き合い方とは?

2022/02/04

AI音声認識技術を活用するサービスは、業務効率化などを目的に、コンタクトセンターやヘルプデスクなどの電話応対業務や受付業務、翻訳や議事録作成、マーケティングなど、さまざまな業種/業界の企業で活用されています。

一方で、AIの音声認識技術は、何でも認識できる完璧な技術ではありません。人の耳で聞き取れないものまで認識することはできません。ですが、きちんと環境を整えたり、認識されるように工夫したりすることで、90%以上の認識率が期待できます。

今回は、音声認識技術を効果的に活用するために、運用で考慮すべきポイントをご紹介します。

特定の人だけきちんと認識されない?認識されやすい“話し方”

「なぜか、いつもあの人だけ、きちんと認識されない…」ということはありませんか?

人によって話すスピードや音量、滑舌などは異なります。そのため、普通に話している時でも、「この人はいつも何て言っているのか分かりづらいな」とか、「この人の話し方は耳に入ってきやすいな」と感じることがあると思います。

人は無意識にこれまでの経験や知識などから、欠如している部分を補完して理解しますが、AIは聞こえた音をそのまま認識させるので、認識されやすい話し方を意識することが重要です。

【音声認識されやすくするためのポイント】
  • ① ゆっくりハキハキ話す
  • ② まくし立てるような話し方はしない
  • ③ 文章の切れ目を意識する(文章の切れ目を意識せずに話すと、切れ目が分からなくなってしまい、文章がつながってしまう原因に)
  • ④ 音量が大きすぎると、音が割れてしまうので、適度なボリュームで話す(マイクを使用している時は、マイクのボリュームを調整するのも効果的)

これらのポイントを意識するだけで、音声認識率はかなり上がるでしょう。
また、コンタクトセンターの現場では、AIの認識精度に合わせた「発話」をするようになったことで、お客さまへご案内する際の話し方が聞き取りやすくなった、説明が伝わりやすくなったなど、AIが人の応対スキルをフィードバックする側面も出てきています。

音声認識結果を他のサービスと連携させたい!
二次利用では「辞書」の管理が重要

  • 音声認識した結果を検索システムと連携して、音声で検索できるようにしたい。
  • 要約サービスと連携して重要なポイントだけがまとまった議事録を作成したい。
  • 分析システムと連携して、新たな知見を「見える化」したい。

このように、音声認識した結果をさまざまなサービスと連携させたい場合、認識率が気になる方も多いのではないでしょうか?他のサービスと連携したい場合も、100%の認識率である必要はありません。「重要なワード」さえ認識できていれば、十分効果が得られます。

そこでポイントになるのが、「辞書登録」です。

2次利用するシステムで重要になるワード(検索システムであれば、FAQに登録されているワードや、分析のキーになるワード)をきちんと辞書に登録しましょう。

重要なワードはそれぞれの辞書に登録してあるけど…という方は、表記揺れや名寄せのルールがそれぞれのシステムの辞書で統一できているかも確認してください。

例えば、「エス・アンド・アイ」というワードを、音声認識システム側は「S&I」で辞書登録し、連携するシステム側では「sandi」で登録していたとします。すると、音声認識システムとしては正しく認識しているにもかかわらず、連携先のシステムでは「S&I」=「sandi」と変換できず、想定している結果が得られなかったという状況が発生してしまいます。

こうした事態を防ぐためにも、2次利用することを考慮して、音声認識側とその先で使うシステムの辞書を管理することを意識してください。
特に、音声認識システムと、その結果を利用するシステムの担当部署が異なる場合は注意が必要です。それぞれのシステムでは、問題なく辞書の管理ができていたとしても、ルールが統一されていなかったために、期待した結果が得られないということもあります。音声認識だけではなく連携するシステムも含めて、全体像を見ながらそれぞれの辞書を管理するようにしましょう。

音声認識させた結果で何をやりたいのか?を意識して、上手に付き合おう。

ここまで、音声認識されやすい話し方、認識結果を二次利用する際のポイントを紹介してきましたが、どこまで認識率を上げるかは、音声認識結果を何に活用したいのかによって異なります。

例えば、音声認識した結果を要約させたい場合は、音声認識の段階でかなりの精度で音声認識させる必要がありますが、コンタクトセンターなどで応対内容を残したい場合は、オペレーターが復唱することで重要なワードだけは確実に認識され、自動で必要な部分だけを抽出することもできるでしょう。

このように、音声認識結果を何に使いたいかによって、求められる精度は異なります。きっちり学習させなければならない事と、運用で対処できる事のバランスを取りながら、付き合っていくことが大切です。

定期的なメンテナンスで認識率を維持!
自社にあった体制を検討すべき

  • 導入当初は認識率が高かったが、利用範囲を広げた結果、認識率が下がってしまった…
  • 社内に運用担当者を置けなく、継続的な辞書登録などのメンテナンスができていない…
  • 音声認識結果を他のサービスと連携して使いたいが、全体を包括的に見れる人材がいない…

  • など、社内にAIの知見がなく不安な場合や、リソースが足りなく運用体制が組めない場合は、外部に委託するのも1つの手段です。

    sandi AIでは、AIのスキルに長けた専門チーム「CORPUS factory」が音声認識の精度向上をご支援させていただいています。音声認識率や運用に課題をお持ちの方は、お気軽にお問い合わせください!