from NTTコミュニケーションズ
AI自然言語処理のビジネス活用――要約サービスの進展について
NTTコミュニケーションズでは、AIサービスとしてCOTOHAシリーズを展開していますが、「COTOHA Summarize」は自然言語処理や音声認識・合成のAPI(Application Programming Interface)をセットにして提供しているCOTOHA APIサービスの要約API部分のサービス名になります。ここでは、「COTOHA Summarize」の利用事例を紹介するとともに、最近の自然言語処理の動向についても触れていきます。
はじめに
インターネットの普及に伴い、数多くの文章が作成・公開されています。動画等の大容量コンテンツが増大した効果もありますが、2020年には総データ量がゼタバイトを超えたといわれ、毎年数10%の成長率で増大しており、すでにすべてを把握することは不可能となっています。データ量の増大とは反比例するかのように、掛けた時間に対するコスト意識(タイパ:タイムパフォーマンス)が2022年の新語大賞に選ばれたように、より短い時間で内容を把握したい、というニーズも顕在化しています。増大するデータ量に対して、それに対して割くべき時間はますます短くなってきているのです。
ビジネスシーンでも、タイパを意識した取り組みの必要性は広がっています。情報の受け手側はその情報が自身に関連するものなのか、また、どの程度時間をかけてもよいのか分からない状態で対応する必要があるため、必要な情報の見落としや読み飛ばしてしまうリスクも高まっています。
これを解決するのが「COTOHA Summarize」です。COTOHA Summarizeが生成する要約によって、情報やレポート全体の概要を把握することができるようになるとともに、その情報やレポートに費消すべき時間も事前に決定することができるようになります。
COTOHA Summarizeについて
COTOHA Summarizeは、NTT研究所で研究開発された要約モデルを基にNTTコミュニケーションズ(NTT Com)で機能追加して提供している要約サービスです。2020年4月にニュース情報や各種レポート、ビジネス文書等の要約に適したモデル(日本語および英語の要約モデル)の提供を開始し、2021年4月にコンタクトセンタ等における顧客とオペレータとの対話の要約に適したモデル(コンタクトセンタ用の要約モデル)も追加提供しています。
COTOHA Summarizeでは要約したい元の文章と要約で得たい文字数・文数(または元の文章に対する圧縮率)を指定することで、生成型および抽出型の要約が可能となっています。抽出型の要約は元文章のうちの重要な文を指定された文数分を選んで要約するのに対し、生成型の要約は、元文章の文をそのままではなく、指定された文字数に応じて、新たに要約としての文章を生成するものです。
要約サービスは、他のサービスやシステムと連携して利用することが多いかと思います。COTOHA SummarizeでもAPI(Application Programming Interface)提供となるため、他のサービスやシステムからAPI連携させて要約利用することができます。例えば、文章を管理しているシステム側から要約したい文章と要約方法等を指定(生成・抽出の種別、要約文字数等の要約率等)してAPIをコールすることで、要約結果をシステム上に反映させることなどが可能となります。
ここでは、NTT Com提供のサービスとの連携例として、「コンタクトセンタでの利用」「チャットでの回答での利用」の2つを紹介させていただきます。
コンタクトセンタでの利用
コンタクトセンタは、顧客からの問い合わせをオペレータが対応し解決していく組織となります。オペレータが対応する顧客には、エンドユーザだけでなく、代理店や販社、社内部署等も含まれ、顧客からの問い合わせに直接対応するオペレータとオペレータの支援・管理を行うスーパーバイザー(SV)から構成されています。
コンタクトセンタでは、一般的に応答率(着信したコールに対するオペレータが応答できた率)等の向上が求められていますが、オペレータはコール終了後に、問い合わせへの対応業務やコール内容の引継ぎ業務等のアフターコールワーク(ACW)を行う必要があります。ACWには、対応を引き継いだオペレータやSVが顧客との対話内容や対応内容を簡易に把握できるように要約を記述する必要があります。応答率等の向上のために、オペレータ作業の効率化が求められており、そのためにACWの自動化による作業時間短縮が期待されています。
これらの課題を解決するために、コンタクトセンタソリューションが提供され、オペレータと顧客との問い合わせ対応内容を音声認識・文字起こしをし、対話内容を管理・分析できるようになってきています。対話内容の自動要約も提供されており、当初は、フィラー(言い淀み)の除去や定義済みの不要語の削除が中心でしたが、最近では機械学習を用いた生成要約が導入されてきています。
NTT Comが提供するコンタクトセンタソリューションであるCOTOHA Voice Insight音声マイニングプランにおいても問い合わせ対応内容を音声認識・文字起こしをし、対話内容を管理・分析する機能が提供されていますが、要約機能(オプション契約が必要)については、COTOHA Summarizeのコンタクトセンタ用のモデルでの生成型を利用した要約が表示されています(図1)。
COTOHA Summarizeでは、要約として問い合わせと回答部分を要約出力するように機械学習していますが、発話者それぞれについて要約出力する等、より把握しやすい要約へと改善を続けています。また、コンタクトセンタによっては、問い合わせ回答の要約だけでなく、賞賛やお礼等の言葉を引継ぎ内容として要約に表示したい、という声もいただいています。これらにこたえるために要約結果をカスタマイズする方法についても改善していく予定です。
チャットでの回答での利用
顧客接点の拡大に伴い、コンタクトセンタ以外にチャットボットでユーザサポートをする企業も増えており、それに対応するように、顧客からのチャットでの質問に対して、チャットボットが回答するサービスが広く提供されています。チャットサービスにおいては、高い回答精度を得るためにはFAQコンテンツの作成が欠かせない作業となっており、この作業は導入時の大きな負担になっていました。
NTT ComでもチャットサービスとしてCOTOHA Chat & FAQを提供していますが、FAQコンテンツの作成が不要な「ドキュメント回答プラン」も用意しています。「ドキュメント回答プラン」では、FAQコンテンツの作成・更新を行わなくても、必要なマニュアルやドキュメントを登録しておくだけで、自動的にチャットの回答を探し出して、チャットに適した長さにCOTOHA Summarizeで要約してチャット応答します(図2)。事前のFAQ作成作業が不要となるため、提供価格の低廉化と構築期間の短縮が可能となっています。
AI自然言語技術の動向について
ここまで、COTOHA Summarizeの利用シーンについて紹介してきましたが、AI技術については2022年後半から生成AIが複数発表され、社会的にも大きな注目を集めています。画像生成AIの分野では、Stable DiffusionをはじめとするオープンソースのAIモデルが公開され、MicrosoftのEdgeブラウザでもImage Creatorという画像生成AIが提供されています。この画像生成AI以上にインパクトがあったのはChatGPTをはじめとする文章生成AIの技術だといえるでしょう。
ChatGPTは2022年11月にOpenAI社からリリースされました。2023年2月にはMicrosoftでもChatGPT技術を活用したチャット検索が「Bing」で公開され、Googleでも対話AI「Bard」が公開されています。これ以外にも各社から文書生成AIの取り組みが発表されています。
これらは、直感的なプロンプトに対して、出力として得たい内容を自然文で記載することで回答を得られるもので、プログラミングレスでも利用できるものです。
基本的な機能は文章生成AIですが、プロンプトへの入力内容を工夫することで指定した文章の要約をさせることもできます。
これらのAIモデルは、大規模言語モデル(LLM:Large Language Model)と呼ばれるものが使われており、数千億の内部パラメータを有し、大量のデータで学習させています。このため、モデルサイズも巨大になり、実行には大量のサーバリソースが必要となっています。また、プロンプトに入力した文章が学習に利用されるため、社内文書の漏洩等のセキュリティリスクを含めた運用性にも課題を有しています。
NTT Comでも、これらのLLM等の技術状況を踏まえながら、運用性、成長性およびセキュリティ等の課題を解決したAI言語サービスを考えていきます。
問い合わせ先
NTTコミュニケーションズ
コミュニケーション&アプリケーションサービス部
E-mail summarize-support-aps@ntt.com