NTT技術ジャーナル記事

   

「NTT技術ジャーナル」編集部が注目した
最新トピックや特集インタビュー記事などをご覧いただけます。

PDFダウンロード

from NTTコミュニケーションズ

高度な日本語自然言語処理を実現する“COTOHA® API”が創る未来

2018年9月、NTTコミュニケーションズ(NTT Com)ではAI(人工知能)を活用した「Communication Engine “COTOHA® API”」(COTOHA API)の本格サービス提供を開始しました。サービスリリース後から、数百の開発者の方にご登録いただき、AIの期待値の高さとともに、すでに表面化し始めているお客さまのさまざまな課題を知ることとなりました。ここでは、COTOHA APIの紹介とともにサービスを提供する中で見えてきたビジネスの可能性について紹介します。

COTOHA APIの概要

「Communication Engine “COTOHA® API”」(COTOHA API)(図1)は、NTTメディアインテリジェンス研究所(MD研)の研究成果である日本語辞書・自然言語処理技術、およびCOTOHAの提供を通じてNTTコミュニケーションズ(NTT Com)が独自に開発した機能をベースとした「テキスト解析」「対話」「音声認識サポート」に活用できるAPI(Application Programming Interface)サービスです。COTOHA APIをお客さまのアプリケーション・サービスに組み込んでいただくことで、ネイティブの日本人でも理解が難しい日本語文章の構造を高精度に解析できるようになり、日本語のテキスト解析・対話・音声認識の導入や精度向上を簡単に行うことができます。開発用途ではどなたでも無料で使うことができ、そのフィードバックを得てさらなるブラッシュアップをかけています。
実際の業務にAI(人工知能)と名の付くプロダクトを導入しようとすると、非構造のビッグデータの解析が難しい、日本語の理解力が低い、音声認識の結果が悪い、表記ゆれが多すぎてデータを正規化できず現実のデータには適用できない、といったさまざまな課題が出てきますが、COTOHA APIは世界最大級の日本語シソーラス辞書*や独自の意味属性を用いた解析を行うこと(図2)で、それらのお客さまの課題を解決することをめざしています。また、お客さま個別に辞書の作成やAPIのパラメータ設定を行い、さらに精度を向上することも可能です。

*シソーラス辞書:単語の上位・下位関係、部分・全体関係、同義関係、類義関係などによって単語を分類し、体系付けた類語辞典・辞書。

図1  COTOHA APIの全体イメージ

図2  COTOHA APIの強みと活用例

COTOHA APIを支える日本語処理技術

日本語言語処理は英語などの他言語に比べて難しいといわれています。まず、日本語では主語や目的語などを省いても文章が成立します。「夏はでかけたりしましたか?」という文は英語にすると「Did you go anywhere this summer?」ですが、「you」「anywhere」「this」といった単語に値する言葉は日本語では省略されています。また、主語・目的語・補語などの語順は自由に入れ替えることができ、「私は夏休みに弟と動物園に行きます」「夏休みに私は動物園へ弟と行きます」「弟と私は動物園へ夏休みに行きます」のいずれも、文として成立しています。このような文を機械に学習させる際には、語順が異なる膨大な量の文章を正解データとして用意する必要が出てきます。COTOHA APIは、このように難しい日本語の自然言語処理をAPIとして提供し、どなたでも簡単に扱えるようにすることを実現しています。近年オープンソースソフトウェア(OSS)がよく使われていますが、MD研の技術では独自に編纂した「日本語語彙大系」という大規模なシソーラス辞書や専門家により継続してアップデートされる辞書により、より高い精度の解析を可能としています。
COTOHA APIで提供している主なAPIについて紹介します。

構文解析API

「構文解析API」では、ユーザの発話の中の事物や動作に対して意味付けを行います。「母と焼き肉を食べた」と「サラダと焼き肉を食べた」という2つの文は、構造は同じですが、「母」と「サラダ」の役割が異なります。構文解析APIでは「食べる」という述語をベースに、「母」は共同の動作主、「サラダ」は動作の対象、といった役割を解析します。例えば、この技術をチャットボットに応用すると、「昨日お召し上がりになったお母様はいかがでしたか」といった誤った発話をしてしまうことを防ぐことができます。
また、表記ゆれについても吸収することができ、「NTTコミュニケーションズ」と「エヌ・ティ・ティ・コミュニケーションズ」などといった表記に対し、どちらも同じ組織を表すということを認識することができます。例えば、RPA(Robotic Process Automation:ロボットによる業務自動化)を実施していくときに、上記のような表記ゆれなどのノイズを吸収して正規化することで、幅広い作業でRPAを活用可能にする、といった利用シーンを想定しています。

照応省略解析API

「あれ」「これ」「それ」「そこ」等の指示語・省略語を検知し、指し示す対象を特定します。例えば「太郎は花子と公園で遊んだ」「彼はそこで彼女と縄跳びをした」という2文が入力されると、「彼」が「太郎」、「そこ」が「公園」、「彼女」が「花子」であるという解析結果を返します。これを用いることで、文書の中で示される指示語の内容を特定し、より学習させやすいデータにする、チャットボットが会話の履歴からユーザの指示語の意図を汲み取る、といったことを実現することができます。

ユーザ属性推定API (β版提供)

「ユーザ属性推定API」では、ユーザの発話などから年代、性別、趣味、職業などの人物に関する属性を推定・出力します。例えば、「明日は部長とゴルフ。奥さんに怒られてしまうけど付き合いだからねぇ。練習行けてないからどうかなー」といった文章に対して、「40~49歳の男性、年収は800~1000万、趣味は釣りや旅行」などの属性を推定します。コンタクトセンタの膨大な会話ログなど、非構造のビッグデータをマーケティングに活用する際に、このようなユーザ属性推定APIやキーワード抽出API等を組み合わせて活用することで、有用な情報を抽出する、といった利用シーンを想定しています。

音声認識誤り検知API

2019年1月に「音声認識サポートAPI」の一環として、「言い淀み除去API」「音声認識誤り検知API」を提供開始しました。「音声認識誤り検知API」では、音声認識処理後のテキストに対して、認識ミスのおそれがある単語を検知・抽出します。例えば、他社の音声認識などと本APIを組み合わせることで、音声認識結果を改善、音声ベースの自動応答システムの精度を向上していくことを想定しています。

AIビジネスの現状とCOTOHA APIの立ち位置

AIのビジネスへの活用が増加するにつれて、その課題も多く目につくようになってきました。ガートナーの「日本におけるテクノロジのハイプサイクル:2018年(1)」によれば、「AI」「仮想アシスタント」に対する期待は2017年度ピークにあると判断されていたものが、現在ではピークを越え、幻滅期へと入りつつあります。これは、PoC(Proof of Concept)や先行事例の結果を通して、実際の取り組みの困難さが明らかにされ、AI導入失敗あるいは中止の事例が出てきたことで、企業がAIの導入に慎重な姿勢を示していることを示唆しています。しかし、同じくガートナーの意識調査結果によると、企業によるAIの導入の成果は確実に認められつつあり、すでにAIを導入した企業ほどAIに対してポジティブな印象を持っているそうです。つまり、企業がいざAIを導入してみるとAIが処理する業務時間をほかの作業に充てられるようになり、従業員の生産性向上につながり、AI導入に対する印象が変わっていくということです。AIはさらに知能を増強させ、企業の生産性向上につながる技術として期待されるという意味で「Artificial Intelligence(人工知能)」というとらえ方から「Augmented Intelligence(拡張知能)」とも呼ばれ始め、ますますAIに注目が集まっています。私たちもCOTOHA APIとは別サービスである「Communication Engine “COTOHA® Virtual Assistant”」の提供を通して、実際にお客さまからそのようなフィードバックをいただいており、AIの導入についての課題を解決し、導入をスムーズにすることで、お客さまにAI導入の価値を体感していただき、さらなるデジタルトランスフォーメーションを推進していただくことができると実感しています。COTOHA APIはお客さまのAI導入についての課題の解決策の1つとして、高精度の日本語自然言語処理技術を部材として組み込んでいただくことで、さまざまなパートナーとイノベーションに向けた協業を進めていくことをめざしています。

今後の展開

総務省の統計(2)によると、今後も日本では少子高齢化が進み、2060年には生産年齢人口世代はピーク時から半減し、4793万人になることが予想されています。労働人口が減ることで既存の業務の人材確保は困難になり、そうした中でのAIやロボットの導入は不可欠なものと予想されています。「人間による判断が必要なもの」「例外ルールが多いもの」「改善することによる利益が見込めないもの(=人間が活動したほうが安上がりなもの)」「人命に直結するもの」など、一定の領域では人間の業務が残り続けるところもあると思われますが、「単純作業の繰り返しであるもの」「24時間365日の稼働が求められるもの」「大量のデータを扱うもの」「少しの改善で多くの利益が見込めるもの」など、多くのところではすでにAIへの置き換えが始まっています。また、技術革新が進むにしたがって、安価に精度高く置き換えられる作業は今後も増えていくと予想されています。それぞれの企業でそれぞれの業務に合ったソリューションをつくるため、Google、Apple、MicrosoftなどのトッププレーヤーたちのAI製品や解析サービスを組み合わせて、自社で開発していくことが増えていくでしょう。そんな中にあって、日本語の文書や会話から精度高く自然言語処理し情報を抽出することは、日本語で業務を行っている領域がある限り、必須の要素技術となっていきます。COTOHA APIは、今後もテキスト解析系APIや音声認識関連のAPIのラインアップを拡充し、高精度の日本語解析を行うことで、お客さまのAI導入の一助となる、あるいはさらなる付加価値をつけられるようなサービスをめざしていきます。

■参考文献
(1) https://www.gartner.co.jp/press/pdf/pr20181011-01.pdf
(2) http://www.soumu.go.jp/johotsusintokei/whitepaper/h29.html

問い合わせ先

NTTコミュニケーションズ
アプリケーション&コンテンツサービス部 AI推進室
TEL 050-3812-4584
E-mail cotoha-api@ntt.com