『カルチャロミクス - 文化をビッグデータで計測する』エレツ・エイデン/ジャン=バティースト・ミシェル
『カルチャロミクス - 文化をビッグデータで計測する』エレツ・エイデン/ジャン=バティースト・ミシェル
グーグル・ Nグラム・ビューワー(Google Ngram Viewer)は、16世紀から今世紀初頭までに刊行された書籍をサンプルに、単語やフレーズの使用頻度をグラフに示す。そして本書のタイトルにもなっている「カルチャロミクス」は、この読み込んだ文献をビッグデータとして活用する人文研究のこと。
さて、16世紀といえば、シェークスピアの時代だ。『ハムレット』などの原文を、学校の授業で読んだこともあるだろう。そう、英語の強みは、16世紀のテキストであろうと、ほとんど問題なく現代人にも読めることだ。一方、日本はどうか? 安土桃山時代や江戸時代のテキストを、予備知識なしで読めるか? いや、そもそも原書のくずした文字を解読できるか?
うん、日本語の場合だと、16世紀はだいぶ厳しい。実は19世紀の明治・大正時代でもキツい。つい最近の昭和初期もヤバい。戦中の新聞ですら、読めなくはないがメチャクチャしんどい。つまり日本語の場合、同じ言語であるはずなのに、時代ごとの変化が激しすぎて、一貫した文献調査を行いにくい。
よって、せっかくグーグルが開発した、新しい人文研究のオモチャを、日本では十分に遊び倒せない。ただし、英語とは別の遊び方を発掘できたら、この限りではない。例えば、時代ごとの変化が激烈である分、そのジャンプの角度や高さを計測できたとしたら……? おや、何だか面白そうな研究ができそうじゃねーの!
歴史も、文学も、言語も、測れば見える、新しい真実。
Googleがスキャンした数百万冊の書籍の中に登場する任意の単語・フレーズの出現頻度を、年ごとにプロットするシステム「グーグル・Nグラム・ビューワー」。開発者が、この技術を使った新しい人文科学研究を紹介する。
- 作者: エレツエイデン,ジャン=バティーストミシェル,高安美佐子,阪本芳久
- 出版社/メーカー: 草思社
- 発売日: 2016/02/18
- メディア: 単行本(ソフトカバー)
- この商品を含むブログを見る