トップページ | Q&Aの一覧 | このサイトについて | ENGLISH

Q&A

Q(ご質問)

大量の文章があるのですが、要約を自動で作れませんか?

A(ご回答)

このご質問は、テキストマイニングへの期待として、2015年頃に数回いただきました。

当時は、「期待されているような要約は作れません。」と答えていましたが、その後状況が変わっています。 このページの以下の内容は、2023年時点の状況を踏まえて、書き直したものです。

テキストマイニングによる要約

「要約は、長文の重要な部分を、短文にしたもの」ということでしたら、テキストマイニングでそのような要約は作れません。 一方、テキストマイニングは、テキストマイニングの見方で、長文から要約のようなものを作れます。

テキストマイニングをすると、頻繁に使われる単語がわかりますし、 その単語とセットで使われることの多い単語もわかります。 その人にとって、未知の分野の文章でしたら、この分析結果を見ると、 「こういう言葉が使われている文章なんだ!」となりますので、「要約」として役に立ちます。

テキストマイニングの使い道としては、このようなものが多いです。

いわゆる要約ではありませんが、文章を俯瞰した見方ができます。

議事録作成のツール

2020年頃から、「議事録を自動作成」というツールが、世の中で出てきています。

ただし、内容をよく見ると、議事録を作成というよりは、文字の書き起こしツールです。 筆者の知る限りでは、音声データを文字データにして、しかも、平仮名の羅列ではなく、 文章らしいものが作られるものが、このようなツールとして販売されています。

筆者もやったことがありますが、文字の書き起こしの仕事は、録音した音声を何度も再生したりするので、実際の会議時間よりも長くかかったりもする大変な作業です。 その点で、こうしたツールは画期的なものです。

また、60分間の会話の音声データについて、再生して内容を確認しようとすると、60分かかりますが、文字になっていると、数分で同じことができたりします。 この点でも画期的なツールです。

要約のツール

2023年時点では、生成AIの応用として、要約のツールが出てきています。 人間が長文を読んで、必要な情報だけを抽出したり、短文にまとめたりする作業を、コンピュータがやってくれるようになって来ています。



Tweet データサイエンス教室