村上征勝 (2004) 『シェークスピアは誰ですか?-計量文献学の世界-』
個々の人間に個性があるように、人が書いた文章にも個性がある。それが「文章の指紋」だ。この指紋は、指紋であるがゆえに、文章を書いた人物の特定に役立つ。
本書で検証されている指紋の例には、次のようなものがある。
名詞や漢字の使用率
単語や文の長さ
語や形態素の個数や使用頻度
読点の付け方
これらの要素を計量分析することによって、文章の個性や著者の判定に役立てる。これが計量文献学である。
指紋分析の俎上に上げられた文献は、「かい人21面相の脅迫文」、「パウロの書簡」、「イザヤ書」、「シェークスピアの作品」、『静かなドン』、「プラトンの『第七書簡』、『源氏物語』などなど、日本ばかりか世界でも有名な作品ばかりである。
このように世界に名立たる作品が取り上げられ、その指紋が分析されているということは、実のところ、それらの作品の筆者が誰であるのかが不明確であることを意味している。では、指紋分析の結果が示すそれぞれの作品の著者像は、いったい、どのようなものなのであろうか?
と、このように書いてみると、計量文献学が著者の特定に役立つ万能分析であるかのように感じられるかもしれない。でも、実際に検証例を見てみると、著者の断定に至っている例は実に少ない。文章の指紋分析を無理やり野球にたとえると、選手Aのバント成功率は40.2%、選手Bのバント成功率は20.8%、そして選手名不明のデータのバント成功率は40.4%である。選手名不明のデータが選手Bのものであるという説があったが、バント成功率をみる限り、むしろ選手Aのものである可能性がある、というようなものである。
計量文献学の手法をどのように評価するのかは見解が分かれるところであろう。私としては、「選手=著者」の顔を見ずして、「データ=文章の形式」から「選手=著者」の姿を絞っていくその姿勢に、興味を覚えた次第である。気になる方は本書を読んでみて下さい。
| 固定リンク
「書籍・雑誌」カテゴリの記事
- 日本十進分類法における言語の分類(その3):言語か歴史か?(2009.04.09)
- 日本十進分類法における言語の分類(その2):中東の言語はどこに?(2009.04.08)
- 日本十進分類法における言語の分類(その1):890番台の言語たち(2009.04.07)
- Ethnologue(2009.04.06)
- 円満字 二郎 『昭和を騒がせた漢字たち-当用漢字の事件簿-』 吉川弘文館(2007.10.04)
