読者です 読者をやめる 読者になる 読者になる

BOOK HUNTING

ノンフィクション系の新刊、近刊を平日5冊、週30冊ペースで紹介。児童書から医学書まで。

『カルチャロミクス - 文化をビッグデータで計測する』エレツ・エイデン/ジャン=バティースト・ミシェル

I T 人文/思想

『カルチャロミクス - 文化をビッグデータで計測する』エレツ・エイデン/ジャン=バティースト・ミシェル

グーグル・ Nグラム・ビューワー(Google Ngram Viewer)は、16世紀から今世紀初頭までに刊行された書籍をサンプルに、単語やフレーズの使用頻度をグラフに示す。そして本書のタイトルにもなっている「カルチャロミクス」は、この読み込んだ文献をビッグデータとして活用する人文研究のこと。

さて、16世紀といえば、シェークスピアの時代だ。『ハムレット』などの原文を、学校の授業で読んだこともあるだろう。そう、英語の強みは、16世紀のテキストであろうと、ほとんど問題なく現代人にも読めることだ。一方、日本はどうか? 安土桃山時代や江戸時代のテキストを、予備知識なしで読めるか? いや、そもそも原書のくずした文字を解読できるか?

うん、日本語の場合だと、16世紀はだいぶ厳しい。実は19世紀の明治・大正時代でもキツい。つい最近の昭和初期もヤバい。戦中の新聞ですら、読めなくはないがメチャクチャしんどい。つまり日本語の場合、同じ言語であるはずなのに、時代ごとの変化が激しすぎて、一貫した文献調査を行いにくい。

よって、せっかくグーグルが開発した、新しい人文研究のオモチャを、日本では十分に遊び倒せない。ただし、英語とは別の遊び方を発掘できたら、この限りではない。例えば、時代ごとの変化が激烈である分、そのジャンプの角度や高さを計測できたとしたら……? おや、何だか面白そうな研究ができそうじゃねーの!

歴史も、文学も、言語も、測れば見える、新しい真実。

Googleがスキャンした数百万冊の書籍の中に登場する任意の単語・フレーズの出現頻度を、年ごとにプロットするシステム「グーグル・Nグラム・ビューワー」。開発者が、この技術を使った新しい人文科学研究を紹介する。

カルチャロミクス;文化をビッグデータで計測する

カルチャロミクス;文化をビッグデータで計測する