from NTT西日本
生成AIが導く新しい学びのかたち、教育支援システム「DAIB」の開発
生成AI(人工知能)技術の教育現場への導入が期待される中、NTT西日本は同志社大学と共同で、教育支援システム「DAIB(Doshisha AI Buddy)」を開発しました。DAIBは、生成AIがチャット形式で学生の質問に個別に対応するシステムです。実証実験の結果、学習意欲向上に効果がみられました。今後も、アンケートやヒアリングをとおして、効果的な活用方法を検討します。また、学習成果の分析を通して多角的に学習効果を分析し、さらなる機能改善を進めていきます。
開発に至った背景
近年のAI(人工知能)技術の進展、特に生成AIの発展は目覚ましく、教育現場においても個別最適化された学習支援や教育の質向上への期待が高まっています。このような背景のもと、NTT西日本は、生成AIの教育現場における可能性を検証し、その導入効果を実際の大学のフィールドで確認したいと考えていました。一方、同志社大学では、文部科学省による大学・高専における生成AIの教学面の取り扱いについての声明を受け、大学における生成AIの適切な導入方法について模索されていました。このように、両者のニーズが合致したことから、共同で実証事業を実施することとなりました。
実証事業の取り組みにおける課題
本取り組みでは、生成AIを教育現場に導入するにあたり、以下のような課題を想定しました。
① ハルシネーション(事実と異なる内容を生成してしまう問題)の発生を抑制する実装方法の確認
② 機密情報や個人情報の流出・漏洩リスクの確認
③ 教科書をはじめ著作権の取り扱いに関する留意点の確認
④ 一般的なチャットボットとの差異の確認、および剽窃(盗作)の可能性
⑤ 学習への活用効果の確認
これらの課題に対し、本実証事業では、NTT EDX社が提供する電子教科書サービス「EDX UniText」と連携し、回答に利用する情報源を電子教科書や講義資料などに限定すること、セキュリティ対策の徹底など、さまざまな対策を講じました。
実証環境
同志社大学では、「数理・データサイエンス・AI教育」に関して、全学部の学生を対象とした全学共通教養教育科目として2022年度から「同志社データサイエンス・AI教育プログラム(DDASH:Doshisha Approved Program for Data Science and AI Smart Higher Education)」を開始し、生成AI等の革新的情報化技術を正しく理解し、利活用できる人物の育成に取り組んでいます(1)。今回の実証事業では、DDASHの授業科目である「データサイエンス概論」と「データサイエンス基礎」において、教育・学習向けの生成AI利用環境を整え、システムの有効性を検証しました。2024年度春学期におけるそれぞれの講義の受講者は、データサイエンス概論が2416人、データサイエンス基礎が124人でした。
DAIB:学生と教員を支援するAIパートナー
DAIBとは、「Doshisha AI Buddy」の略称であり、学生と教員をAIで支援するシステムです。Microsoft Azure(パブリッククラウド)上に構築され、Microsoft Teams(コミュニケーションツール)をとおして、Azure OpenAI(生成AIモデル)に問い合わせを行い、チャット形式で個別の授業に特化した質疑応答を可能にします。
■DAIBの主な機能
DAIBは、学生向けと教員向けの機能を備えています。
(1) 学生向け機能
① 「講義内容の要約」:授業回ごとに登録された資料(電子教科書や参考書等のデータ)に基づいて、要約を自動生成します。学生の習熟度に合わせて、「簡易要約」と「詳細要約」の2種類を提供します。簡易要約は、講義内容の主要なポイントを簡潔にまとめたもので、予習や復習に役立ちます。詳細要約は、より詳細な情報を含み、重要な概念や理論を深く理解したい学生に適しています。
② 「設問作成」:授業内容に基づいた多肢選択式問題や記述式問題を自動生成します。学生は、問題を解くことで、自己学習を進め、理解度を確認できます。
③ 「キーワード解説」:講義資料や参考資料に含まれるキーワードの中から重要なキーワードを抽出し、解説します。専門用語や概念の理解を深めるのに役立ちます。
④ 「フリーワード質問」:学生は、自由に質問を入力し、回答を得ることができます。授業内容に関する疑問に関して質問したい場合や、より深い理解を得たい場合に活用できます。教員は、学生がどのような質問をしたかログを確認することで、教育指導の改善に活かすことができます。また、質問への回答に合わせて関連する資料のリンク先を表示することで、電子教科書や参考資料へのアクセスを容易にし、学習効率を向上させます。
(2) 教員向け機能
① 「スライド生成支援」:授業で用いられるキーワードを入力することで、授業用の教材スライドのアウトラインを自動生成します。教員は、生成されたアウトラインを参考にすることで、講義資料を作成できます。この機能は、教員による教材作成の負担軽減に貢献します。
② 「設問作成」:学生向け機能と同様に、授業内容に基づいた問題を自動生成します。教員は、生成された問題を参考に試験問題の作成や課題を提示することができます。
■ユーザインタフェース
DAIBのユーザインタフェースは、複数の選定案から最適なものを採用しました。当初は機能面を重視し、独自のアプリケーションを構築する案や、既存の学習管理システム(LMS)に組み込む案も検討しました。しかし、独自のアプリケーションは開発コストが高く、学生にとって新たな操作体系の習得が負担となる可能性がありました。LMSへの組み込みは、既存システムとの連携に課題があり、柔軟性に欠けるという懸念がありました。一方、同志社大学ではすでにMicrosoft Teamsが導入されており、学生にとって使い慣れたユーザインタフェースであるため、Microsoft Teams上にシステムを構築することで、開発コストを抑えつつ、学生の利便性を最大限に確保できると判断しました。
■システム構成
DAIBは複数のAzureサービスを連携させることで実現しています(図1)。ユーザインタフェースとしてMicrosoft Teamsのデスクトップを採用し、ユーザからの質問をCopilot Studioを介してAzure OpenAIに送信します。Azure OpenAIは、GPT-4.0-turboを基盤とした大規模言語モデルを用いて質問を解析し、回答を生成します。
回答生成には、事前に登録された電子教科書や参考書等の資料群が参照されます。資料はPower Appsアプリケーションを通じてシステムに登録され、OCR(Optical Character Recognition)処理によってテキストデータに変換された後、Blob Storageに格納されます。さらに、AI Searchを用いてテキストデータのインデックス化を行い、効率的な検索を可能にしています。Azure OpenAIは、AI Searchによるインデックス化された資料を解析し、質問に最適な回答を生成します。Copilot Studioはローコード開発ツールであり、GUI(Graphical User Interface)操作によってTeams上での表示制御や、Functions、Azure OpenAIとの連携を容易に実装できます。
■セキュリティへの配慮
DAIBは、堅牢なセキュリティ機能を備えたMicrosoft Azure OpenAI Service上で構築されています。多要素認証やアクセス制御リスト、ロールベースアクセス制御など、Azureのセキュリティ機能を活用することで、データの機密性と完全性を保護します。学生の質問内容や学習履歴などの個人情報は、Azureのセキュアな環境下で暗号化され、厳重に管理されます。これにより、不正アクセスや情報漏洩のリスクを最小限に抑えます。DAIBへのアクセスは、認証されたユーザに限定されます。学生は、大学のアカウントでMicrosoft TeamsにログインすることでDAIBを利用できます。教員は、個別の授業を担当する教員のみがアクセス権限を持ち、学生の質問内容や学習状況を確認できます。DAIBは、サービス提供に必要な最小限のデータのみを収集します。学生の氏名、学籍番号などの個人情報は、必要最低限の範囲でのみ利用されます。Azureは、24時間365日の体制でシステムを監視し、不正アクセスや異常な挙動を検知した場合には、迅速に対応します。
これらのセキュリティ対策により、DAIBは学生のプライバシー保護に最大限配慮し、安全な学習環境を提供しています。
■技術的な側面:RAGの活用
DAIBでは、生成AIのモデル性能を向上させる手法として、RAG(Retrieval-Augmented Generation:検索拡張生成)を採用しています(表)。RAGは、外部の知識ソースを参照して回答を生成する技術です。DAIBでは、教員が選択した教材や講義資料、電子教科書などを知識ソースとして活用しています。
生成AIのモデル性能を向上させる手法としては、RAGのほかにファインチューニングが挙げられます。ファインチューニングは、既存の生成AIモデルに対して、特定のタスクに特化した追加学習を行うことで、そのタスクにおける性能を向上させる手法です。
RAGとファインチューニングは、どちらも生成AIの性能を向上させるための有効な手法ですが、それぞれにメリットとデメリットがあります。ファインチューニングは、特定のタスクに対する精度を高めることができますが、新たな知識を追加する場合には、再度学習を行う必要があり、柔軟性に欠けるという側面があります。これは、例えば、新たな学術論文が発表された場合や、授業内容が更新された場合など、知識ソースを頻繁に更新する必要がある状況において、ファインチューニングでは都度再学習が必要となり、対応が遅れてしまう可能性があることを意味します。一方、RAGは、外部の知識ソースを参照するため、新たな知識を柔軟に追加することができます。また、ファインチューニングに比べて、学習コストが低いというメリットもあります。
実証結果
2024年の春学期において、データサイエンス概論では登録者の64.8%にあたる1565人、データサイエンス基礎では登録者の62.9%にあたる78人がDAIBを利用しており、いずれの授業でも多くの学生に利用されました。データサイエンス概論におけるDAIBの利用状況と、データサイエンス基礎におけるDAIBの利用状況を図示します(図2)。アンケート調査の結果、多くの学生がDAIBの利用によって学習意欲が高まったと回答しており、特にキーワード解説機能やフリーワード質問機能は、学生の理解を深めるうえで効果的であったと評価されています(図3)。
■課題に対する考察
実証結果を踏まえ、冒頭に記載した5つの課題について考察します。
① ハルシネーション:電子教科書や参考書等の授業で実際に利用するデータのみをRAGとして活用したことにより、ハルシネーションの発生を抑制することができました。また、生成AIの回答に関連する電子教科書や参考書等へのリンクを設定することで、参照元のデータを確認することができるなど、回答の精度や正確性を向上させることができました。
② 機密情報や個人情報保護: Azureのセキュリティ機能を活用することで、機密情報や個人情報の流出・漏洩のリスクを最小限に抑えられました。
③ 著作権:電子教科書配信サービス「EDX UniText」と連携することで、デジタルコンテンツ、デジタル教材などは、不正コピー防止がされており、著作権保護された教材のセキュアな環境での利用を実現しました。
④ 剽窃(盗作):学生に対して、DAIBの出力内容をもとにレポートを作成する課題を提示し、併せて、そのままレポートなどに使用することは剽窃(盗作)にあたる可能性があることを注意喚起しました。
⑤ 学習への活用効果:アンケート結果から、多くの学生がDAIBの利用によって学習意欲が高まったことが示唆されました。特に、要約機能は予習・復習に、設問機能は復習やテスト前に有効であると期待されます。
社会実装に向けた今後の課題
今回の実証実験を、実際のサービス・ソリューションとして実現するにあたり、以下のような課題を想定しました。
① 最適な実装方法の継続的な確認:今回は、同志社データサイエンス・AI教育プログラム(DDASH)の講義向けに開発を行いましたが、他分野における実装も見据え、的確な回答を生成するプロンプトの検討や教員が自身の講義の生成AIを自在に準備できるようなユーザインタフェースの最適化などを検討する必要があります。
② 生成AI利用モデルの検証:今回の実証において、生成AIに対する質問の仕方にばらつきがあったことが確認できており、学生が生成AIを利用する際に回答の精度を高める「質問の仕方やコツ」について検討します。また、教員に対して、教材作成や理解度評価など、生成AIの活用方法を提示し、生成AIを利用しやすい授業設計を提案します。
③ 生成AI活用による学習効果の分析:学生の質問内容や生成AIの活用頻度、活用シーンなどを分析し、生成AIが学生の成績や学習効果に与える影響を検証します。
まとめ
本実証事業を通じて、生成AIを活用した教育支援システムDAIBは、学生の学習意欲向上や個別最適化された学習支援に一定の効果があることが示唆されました。今後は、前述の課題解決に取り組みながら、より効果的な生成AIの教育利用を推進していく予定です。
■参考文献
(1) 岡部・木本・宿久:“大規模私立総合大学における生成AIを用いたデータサイエンス・AI教育,”CIEC,2024.https://conference.ciec.or.jp/pdf/2024pcc/pcc047.pdf
問い合わせ先
NTT西日本
ビジネス営業本部
TEL 06-6136-3142
E-mail ml-ai@west.ntt.co.jp