文学を科学するレポート「理解と鑑賞を差し置いて科学は文学を要約した」

最終更新日

これは,2012年,大学3年生の僕が授業の課題レポートに書いた文章.当時も深層学習の技術を自然言語処理に活用するアイデアは存在しただろうけど,少なくとも僕は知らなかったね.それでも形態素解析共起ネットワークといった要素技術に (明示的ではないけれど) 言及して,機械による要約生成の可能性を論じてて面白い.当時の僕が無い知恵を絞った痕跡が見られて大変良いと思う.

当時の本文には見出しが無かったので,この転載に当たり新規に追加した.割と論点が明確なレポートなので,見出しを追加するのは大変じゃなかったね.2022年1月現在で僕の知る限り最も先進的な自然言語処理模型 GPT-3 が,文学を「理解」したり「鑑賞」したりしてるかどうかはまだ分からない.でも確かに「要約」はこの10年でかなり前進した分野と言える (Elyza Digest は好例だ) から,先見の明のあるレポートとすら言えるかもしれないね.

  1. 機械による文学の要約,理解,鑑賞
  2. 工学的定式化と親和的な要約生成
  3. 機械要約は,理解や鑑賞に依存しない
  4. 語彙のグラフ表現が要約生成の糸口に
  5. 豊かに広がる文学の科学のフロンティア

機械による文学の要約,理解,鑑賞

文学の科学的分析可能性について考える。その前に授業の感想を少し。シンポジウムで三人の先生方が議論して意見を言い合っているのはかなり刺激的で面白かった。しかし三者三様に、議論の焦点が違う。

先生 A は長い文章(小説のようなものでなく論文のようなものが主な対象であったと思う)を機会に読ませ、その要約を抽出するアルゴリズムの可能性を模索して「文学を科学する」といっている。機械が文章の意味を「理解」する必要はなく、「テキストの読み込み」という入力に対し「要約の書き出し」を出力として返せれば達成したことになる。また先生 B はより進んで、機械に人間と同じように文学(この文学とは小説のようなものを指す)を味わわせることができないかということを指して「文学を科学する」といっている。しかしこの研究の最終目的は機械に小説を読ませることそのものではなく、人間の「認知」という行動の構造の分析手法の一つ、という位置づけだ。そして先生 C はもっと素朴に「小説を読む、そして感想を持つ、それを人に伝える」という過程を機械にさせられるかを焦点に「文学を科学する」といっている。

工学的定式化と親和的な要約生成

先生 A の言うのは「科学」するという言葉から少し離れている。先生 B は「科学」したい対象は文学の側よりむしろ人間の認知の側にある。先生 C はもっとも字義に忠実に「文学を科学する」ということを考えていた。三人の持つ「文学を科学する」という言葉の定義がばらばらで、聞いていてかみ合ってない箇所がたくさんあったような気がする。それはここに書いておきたい。

そして私がこれから考えたいのは、先生 A に近い考え方である。あるテキスト、文字列を機械に取り込んで、それの要点を損なわずに文章の長さだけを短縮することができないか、ということを考える。これが以下で述べる「文学を科学する」という言葉の定義だ。

機械による要約は,理解や鑑賞に依存しない

それを考えるにあたり、画像の分析を元に、そこからのアナロジーで考えていきたい。写真を撮るときにオートフォーカスという機能がある。機械が被写体の輪郭をもっとも克明に捉えることができる焦点距離に自動的に調節する機能である。これは機械にある特定のものに注目せよ、という指令を実行しているように見える。これが可能であるならば、あるテキストを与えて注目するべき箇所をあらかじめ指定しておけば、要約を作ってくれそうな気がする。

しかし、オートフォーカスという機能は思っていたよりも単純な構造だった。カメラが被写体を選んで注目しているわけではなく、物理的に集光した電磁波の位相差の検出によったり、写った像のコントラストが最大になるピントを選ぶ方式だったり、いずれにせよ機械が能動的に考えてピント合わせしているわけではない。機械が、人間がピント合わせするときと同じように考えてピントを合わせているわけではなく、物理的なパラメータを調整していたり、画像認識の技術を応用しただけなので、機会がピンボケを「あぁぼけているな」と認識する人工知能はないのだ。やっていることはある物理量の計測と、その差の計算という単純なものでしかない。ピンボケそのものを捕らえているのではない。

しかしこれは大きなヒントになりうると私は考えた。機械がピンボケそのものを理解する必要はなく、先生 A も言っていたが入力に対し、適切な加工を施して返してくれるだけでいいのだ。これは先生 B や先生 C の主張とすれ違う部分ではないだろうか。

語彙のグラフ表現が要約生成の糸口に

例えば夢十夜の第七夜を要約してみよう。

「私は大きな蒸気船に乗って、何日もずっと波に揺られてどこかを目指していた。どこを目指しているのか分からない。水夫に尋ねても答えなかった。行方を不安する女がいた。星を眺める男がいた。私は退屈になって、死んでしまおうと船から海へ飛び降りた。飛び降りてからやっぱり止めればよかったと後悔の念に苛まれ、永遠にたどり着かない水面へと苦しみながら落ちていった。」

こんな感じであろう。これを機械にやらせることを考える。その手法としては、文中の単語を適切に抜き出して並べ替えればよいだろう。現在の技術では、テキストを取り込めばどこからどこまでが一単語であるかは分析できるそうだ。その装置を用いて単語に分解し、一文で用いられている単語のつながりをネットワークにまとめて、テキスト全体にわたり何度も繰り返されるつながりを要点と見なせばよいのである。

豊かに広がる文学の科学のフロンティア

まだ未完成な分野であるが、確実にこれから完成されていく分野であると思う。可能性は大きい。先生 B の目標とするような「認知科学的に基づいた、人間と同じプロセスでテキストを認知し処理し、計算機にテキストを理解させる、味わわせる」といったものよりはかなり簡単に実現できると思う。なぜなら機械の行う演算に、「理解」という人間独自の操作を必要としないからだ。

しかし背景の違う三人の考えに触れられた経験は非常に意義深かった。「要約の出力」「認知科学の大成」「模範の読み(それは存在しないという主張だったが)」という別々の目標を持つ人の話し合いは、新たな視点を獲得して自らに生かすことのできる貴重な場であったのではないかと察するし、わたしにとってもそうであったからだ。

コメントを残す

%d人のブロガーが「いいね」をつけました。