大量の文章があるのですが、要約を自動で作れませんか?
このご質問は、テキストマイニングへの期待として、2015年頃に数回いただきました。
当時は、「期待されているような要約は作れません。」と答えていましたが、その後状況が変わっています。 このページの以下の内容は、2023年時点の状況を踏まえて、書き直したものです。
「要約は、長文の重要な部分を、短文にしたもの」ということでしたら、テキストマイニングでそのような要約は作れません。 一方、テキストマイニングは、テキストマイニングの見方で、長文から要約のようなものを作れます。
テキストマイニングをすると、頻繁に使われる単語がわかりますし、 その単語とセットで使われることの多い単語もわかります。 その人にとって、未知の分野の文章でしたら、この分析結果を見ると、 「こういう言葉が使われている文章なんだ!」となりますので、「要約」として役に立ちます。
テキストマイニングの使い道としては、このようなものが多いです。
いわゆる要約ではありませんが、文章を俯瞰した見方ができます。
2020年頃から、「議事録を自動作成」というツールが、世の中で出てきています。
ただし、内容をよく見ると、議事録を作成というよりは、文字の書き起こしツールです。 筆者の知る限りでは、音声データを文字データにして、しかも、平仮名の羅列ではなく、 文章らしいものが作られるものが、このようなツールとして販売されています。
筆者もやったことがありますが、文字の書き起こしの仕事は、録音した音声を何度も再生したりするので、実際の会議時間よりも長くかかったりもする大変な作業です。 その点で、こうしたツールは画期的なものです。
また、60分間の会話の音声データについて、再生して内容を確認しようとすると、60分かかりますが、文字になっていると、数分で同じことができたりします。 この点でも画期的なツールです。
2023年時点では、生成AIの応用として、要約のツールが出てきています。 人間が長文を読んで、必要な情報だけを抽出したり、短文にまとめたりする作業を、コンピュータがやってくれるようになって来ています。