NTT技術ジャーナル記事

   

「NTT技術ジャーナル」編集部が注目した
最新トピックや特集インタビュー記事などをご覧いただけます。

PDFダウンロード
デジタルトランスフォーメーションの未来を切り拓く先進的メディア処理技術 ―― コンタクトセンタAI

コンタクトセンタAIの先進的取り組み

コンタクトセンタは、多くのお客さまの声が集まる顧客接点としての重要性が増しています。NTTメディアインテリジェンス研究所では、AI(人工知能)の適用先に、コンタクトセンタを注力分野の1つとして研究開発を進めています。本稿では、私たちが長年培ってきた音声・自然言語処理技術を活用した、コンタクトセンタのさまざまな課題を解決するための最新技術について紹介します。

田中 公人(たなか きみひと)†1/ 八木 貴史(やぎ たかし)†1/ 飯塚 哲也(いいづか てつや)†2

NTTメディアインテリジェンス研究所†1
NTTメディアインテリジェンス研究所 所長†2

はじめに

第三次AI(人工知能)ブームが産業界で本格化してから3年以上が経過し、さまざまな分野でAIの実利用が始まっています。NTTグループでは2016年6月にAIブランドcorevo®を発表しさまざまな取り組みを進めています(1)。第三次AIブームをもたらした主要な技術は、機械学習、とりわけ深層学習(ディープラーニング)であることは疑いようがありません。深層学習は基本技術としてさまざまな問題に適用することができますが、単に適用するだけでは実際のビジネスで利用できるだけの性能が得られないことがほとんどです。適用する問題に特化したネットワークモデルを創出し、適切なデータを用いて学習することで、初めて実利用に足りる性能を発揮することができます。
初期のAIの議論に汎用型AIと特化型AIというものがあります。汎用型AIは人間の頭脳のように1つのAIであらゆる問題を解こうとするものですが、まだまだ実現には遠い状況です。一方、特化型AIは特定の問題のみを解くことができるAIで、現在のAIはすべて特化型といえます。問題を特化することで、人間並、あるいは人間以上の性能を発揮するまでになってきています。つまり、現在のAIをうまく使っていくには、適用分野を定めて、問題に適応していくことが重要になります。
NTTメディアインテリジェンス研究所では、AIの適用先としてコンタクトセンタを注力分野の1つとして研究開発を進めています。コンタクトセンタは多くの電話やチャット応対が日々行われ、多くのナレッジ検索や通話分析が行われています。つまり、私たちが長年培ってきた音声・自然言語処理技術を活かすことができるフィールドの1つといえます。NTTグループには多くのコンタクトセンタがあり、技術をブラッシュアップするための多くのフィールドとデータが存在します。これらの蓄積と環境を活かして、実ビジネスに適用可能な技術の創出をめざしています。

コンタクトセンタの課題

コンタクトセンタは、お客さまへの対応業務を電話、電子メール、チャットなどのさまざまなチャネルを通じて行うことを専門とする部署です。もともとは、申込受付やお客さまサポートを行う運営拠点として位置付けられていましたが、近年のビジネス環境の変化により、多くのお客さまの声が集まる顧客接点としての重要性が増しています。国内コンタクトセンタを取り巻く環境は、深刻化する人手不足に悩まされており、オペレータの採用や定着化が大きな課題となっています(2)。また、応対品質、すなわちCX(Customer Experience)の向上も同時に求められており、特に人の入れ替わりの激しいセンタでは、少ない人数・初級者の多いメンバという限られた運営リソースの中、いかにCXを高めるかがコンタクトセンタ・マネジメントにおける大きな課題となっています。

コンタクトセンタにおけるAI

コンタクトセンタには、IVR(Interactive Voice Response)、CTI(Computer Telephony Integration)、ナレッジシステム、CRM(Customer Relationship Management)など、多くのITシステムが導入されています。AIはこれらのシステムを高度化するとともに、新たな機能を提供し、さらなる運営の効率化やCX向上を図ります。
コンタクトセンタにおけるAIの代表格として、音声マイニング技術が挙げられます。音声マイニング技術は、深層学習の適用による音声認識精度の飛躍的な向上により、実用の領域に入り、コンタクトセンタにおいてもっとも導入が進んでいるAIの1つです。NTTでは、NTTテクノクロスを通じて、音声マイニング技術(ForeSight Voice Mining: FSVM(3))の商用展開を行っています。音声マイニング技術は、「通話音声を音声認識によりテキスト化」し、「大量通話の中からコンタクトセンタ運用の課題やその解決方法のヒントを得るための統計分析・見える化」を実現します(4)。統計分析を行うことで、例えば高スキルオペレータの応対ノウハウを抽出し、センタ内に水平展開して全体のスキル向上を図ったり、センタ全体の統計情報を一覧表示することで、異常な事象(例えば、特定内容の問合せの急増)を即座に把握することができます。また音声がテキスト化されているので、通話が終わった後に会話の詳細を素早く見直すことができ、応対履歴の投入作業が早く・正確に行えるようになります。これらの機能はすでにNTTグループ内外のさまざまなコンタクトセンタで活用されており、業務効率化や売上向上などの成果を達成しています。
音声マイニング技術の構成例を図に示します。音声マイニング技術では、入力された通話音声データに対して音声認識が行われ、その結果は通話分析部にてアナリストが所望する分析に利用されます。音声マイニングは、コンタクトセンタにおけるAIのプラットフォーム的な役割を担い、他のAIモジュールを追加することによって音声認識結果をより高度に活用する機能を追加できます。NTT研究所では、音声通話から感情などのテキスト以外の情報を抽出するAIの研究開発を行っています。これらのAIにより音声認識部を拡張することで分析の幅を広げることができます。また、オペレータの応対支援に向けて、音声認識結果のテキストを用いてナレッジ提示や生成を行うAIの研究開発を進めています。これらのAIは、音声マイニング技術をプラットフォームとして活用して構築できるように構成されています。これにより、早期にコンタクトセンタの現場で動作させることが可能になっています。

図 音声マイニング技術の構成例

さらなる高度化に向けて

音声マイニング技術の商用展開を通じて、新たな課題がみえてきています。

① お客さま音声の認識精度のさらなる向上
② 音声認識結果を活用したさらなる価値創造
③ 導入時のAIチューニング等のコスト削減・時間短縮

現在、コンタクトセンタにおけるオペレータ音声の認識精度は90%を超えます。しかしながら、お客さま音声の認識精度はこれよりおおむね10ポイント程度低くなります。お客さま音声は、話す場所によっては背景ノイズが大きく、携帯電話であれば符号化による音質劣化などがあります。また、オペレータと比較すると発声が不安定で話し方もくだけており、音声認識にとって困難な条件が多くなります。現在のお客さま音声の認識精度は、認識結果を人間が見て理解するという用途や、単語レベルの統計分析を行うなどの用途では利用可能なレベルにあるといえます。しかしながら、認識結果テキストをナレッジ検索や生成など、高度に活用していくためには、より正確な認識が求められています。本特集記事『進化を続ける音声認識エンジン「VoiceRex®」』では、①を解決するための最新技術について紹介します。
音声マイニング技術の導入に伴い、音声認識結果をより高度に活用した、さらなるオペレータの支援の高度化やコスト削減の要望が増しています。②に対して、NTT研究所では、オペレータ応対に必要なナレッジの獲得を容易にするナレッジ支援に関する研究開発に力を入れています。
本特集記事『機械読解による自然言語理解への挑戦』では、質問に対する答えをマニュアルなどから導き出す技術について紹介します。コンタクトセンタで用いられるナレッジには、FAQ(Frequently Asked Questions)、マニュアル、約款などがありますが、FAQが十分に整備されていないコンタクトセンタが少なからず存在します。機械読解は、FAQ検索のように事前に質問と回答のペアを準備する必要がなく、ナレッジ整備コストの削減が期待されます。また、オペレータへのインタビューによると、「普段から研修などで使っているマニュアルのほうがFAQよりも慣れていて使いやすい」「FAQに記載のない問合せは、結局マニュアルを見なくてはいけない」といった意見もあり、オペレータの利便性という観点でも期待が高まっています。
本特集記事『オペレータの応対を支援する自動知識支援システム』では、音声認識とFAQ検索の連携により、適切なタイミングで適切なFAQを、オペレータが応対中に自動提示する自動知識支援に関して紹介します。自動知識支援はオペレータがナレッジを調べる時間を削減します。また、音声認識結果を用いたFAQ整備作業の効率化に関する取り組みについても合わせて紹介します。
音声認識などのAIは、適用する現場ごとにチューニングを行うことで精度を高めることができますが、特に小規模なコンタクトセンタなどへの導入に向けては、チューニングに必要となるコストの削減、時間の短縮が重要となります。③について、NTT研究所では新技術創出による精度向上と合わせて、ベースとなるAIモデルの強化による現場ごとのチューニング作業などの軽減にも力を入れています。これまでに、通話音声などの学習用データを大量に収集し、音声認識やナレッジ検索の業界別ベースモデルを作成しています。業界別ベースモデルを構築した主要な業界では、少ない学習データで追加学習するだけで、短時間・安価に高い精度を実現することができるようになっています。

AIの利用シーン拡大に向けて

深層学習の出現やコンピュータの性能向上による大量データ学習等により、音声認識や自然言語処理の精度は飛躍的に向上し、ビジネス現場への普及が拡大しつつあります。今後は、本稿で紹介した技術をはじめ、さまざまなメディア処理技術を活用してパートナー様とビジネスにおける成功事例を積み上げるとともに、AIの利用シーン拡大に向けてさらなる革新的な技術の研究開発を推進していきます。

■参考文献
(1) https://www.ntt.co.jp/corevo/
(2) 月刊コールセンタジャパン編集部:“コールセンタ白書2018、”リックテレコム、2018。
(3) https://www.ntt-tx.co.jp/products/foresight_vm/
(4) 河村・町田・松井・坂本・石井:“コールセンタにおけるAIの活用、”NTT技術ジャーナル、Vol.28, No.2, pp.35-37, 2016。

(左から)飯塚 哲也/田中 公人/八木 貴史

新しい技術は時として既存の手段よりも劣っている部分が目につくことがありますが、うまく使いこなした企業は、技術の進化とともに競争優位を獲得します。ぜひコンタクトセンタAIをご活用ください。

問い合わせ先

NTTメディアインテリジェンス研究所
知識メディアプロジェクト
TEL 046-859-5305
E-mail kimi.tanaka@hco.ntt.co.jp