記事要約をAIで瞬時に!ネット配信をスピードアップする技術

精度の高い「記事要約」には、人の目が欠かせない

私たちにとって非常に身近な存在である「新聞」。最近の新聞社は、伝統的な紙媒体に加え、WebニュースやSNSなど、様々な情報を配信しています。記者の仕事は政治、経済、国際問題から教育、文化、スポーツの取材まで多岐にわたっています。情報の伝達にはスピードアップが求められる現代、記者は日々研鑽を積んで情報を配信しています。

紙媒体以外のメディアにニュースを配信するプロセスには、主に「配信記事の選定」「メディア編集システムへの送信」「記事要約」「見出し作成」「校閲」の5つがあります(注1)。そのうち最も時間を要するのが「記事要約」です。記事の重要部分を人間の目で判断しながら、メディアごとに異なる文字数で要約する必要があるため、作業には一定の時間と手間がかかってしまいます。

従来の自動要約には、対象記事の冒頭から数文を抜粋していく「LEAD法」という手法があります。しかし、指定された文字列の範囲内で先頭から文を抽出してしまうため、重要な文章が中程や文末にある時は、抽出することができないケースがありました。重要部分を残しつつ、なおかつ短時間で自動要約したい――このような作業は、実はAI(人工知能)の得意分野でもあります。

  • (注1)信濃毎日新聞社様のCATV向けニュース配信サービスでのプロセスの例。

富士通の独自技術にAIを組み合わせ、人と同じ精度を実現

このたび、信濃毎日新聞社様と富士通研究所は、信濃毎日新聞社様が発信する記事をAIで自動要約する技術の実証実験を行いました。

実証を行ったのは、記事配信サービスの中でも特にCATVに向けた「文字ニュース配信」の要約です。信濃毎日新聞の過去記事と、それらを配信サービス向けに人手で要約した約2,500セットの記事に、富士通研究所が開発した自然言語処理技術と機械学習を組み合わせてモデル化しました。

「重要な単語を含む文」「文頭・文末に近い文」「多くの文と類似する文」を重要とみなし、「すなわち」「つまり」で始まる文には加点、「例えば」で始まる文は減点するなど、指標を決めます。これらを機械学習し、文単位で重要度を評価する「重要文抽出モデル」を構築します。これにより、記事の中程や文末からも重要な要素を抽出でき、人手と同じように精度の高い要約文を作成できます。

記事先頭以外からも重要文を抽出して自動要約をした例

3分~5分かかっていた要約作業を瞬時に完了

実証では、1件あたり3分~5分程度かかっていた記事要約作業を、瞬時に終えることができました。実際に導入できれば、従来の要約作業に比べて約5割の時間短縮が期待できます。

この自動要約システムを応用し、今後、CATV向け文字ニュースだけでなく、電光掲示板ニュースやSNSなど、様々なメディアで自動要約モデルを活用することも考えられます。今後、富士通では、汎用性の高いAI機能をAPIとして提供するサービスを「Zinraiプラットフォームサービス」の一部として提供し、自治体・製造・運輸・医療・メディアなど様々な分野で活用することを目指します。