fc2ブログ

Uncharted Territory

自分が読んで興味深く感じた英文記事を中心に取り上げる予定です

RSS     Archives
 

ビッグデータは多読派、むしろ、バカ読み派

 
The Rise of Big Data
How It's Changing the Way We Think About the World

By Kenneth Neil Cukier and Viktor Mayer-Schoenberger
May/June 2013

自分は多読派、しかも何でもいいから出来る限り量を読みこむことを信条とするバカ読み派です。精読もしますが、まずは多読をできるようにならないといけないと思っています。今回は、その当たりのバイアスがかかった記事になります。

ゆっくり読んでわからないものは、速く読めるわけがない。

こういうことを書くと上記のようなことを言って、精読の重要性をとうとうと述べるのが英語教師をはじめとする方々でしょう。でも、こういうことを言う人たちが多読や速読をできる人になっているでしょうか。こういうことを言う人たちの顔を思い浮かべてください。5年経っても、10年経ってもTOEICをはじめとする資格試験から抜け出せていない人ばかりで、3か月以上もかけてスティーブジョブズの伝記を読むとか(しかも未だに読み終わっていない。。。))、あげくには「英語の本は読まない」とか「本なんて最近読んでないな」とツイッターするような人になってしまっています。

精読を全面否定するつもりはありませんし、とても重要なことだと自分の経験からも言えますが、何でもいいからたくさん読む癖をつけないと、いつまでも精読だけの人、いや精読でちゃんと読めればいいですが、英検1級・990取った人がTIMEもろくに読み進めなかったり、No option is off the tableを「テーブルに乗らない選択肢はない」と的外れな解説しか書けない冴えない人にしかなれないんじゃないかという恐れがあるんです。そんなんじゃ精読すらできていないじゃないですか。

精読が不要だと言っているのではありませんが、英語教師をはじめとする英語学習者は量を読めない、ネイティブ向けの普通の本や雑誌が読めない人が圧倒的多数なので、「量が質に転化する」アプローチの大切さをこのフォーリンアフェアーズの論稿から学んでみるのも価値があると思います。それに、ビッグデータも流行っていることですから(笑)

Instead of trying to “teach” a computer how to do things, such as drive a car or translate between languages, which artificial-intelligence experts have tried unsuccessfully to do for decades, the new approach is to feed enough data into a computer so that it can infer the probability that, say, a traffic light is green and not red or that, in a certain context, lumière is a more appropriate substitute for “light” than léger.

コンピューターに物事の進め方を、例えば車の運転や言語の翻訳を「教えようとする」のではなく、この試みは人工知能の専門家たちが何十年もの間取り組んできて成果を上げていない、新しいアプローチというのは、十分なデータをコンピューターに与えることで可能性を推測できるようにするのである。例えば「今は信号機は緑で、赤ではない」とか、ある特定の文脈では、lumière(フランス語で「光」)という語がléger (フランス語で「軽い」)よりも英語のlightに適切に対応する語であるとかである。

*次のパラグラフはXX requires three profound changes in YYとあって、The first is to … / The second is to … / Third…とセオリー通り書いています。

Using great volumes of information in this way requires three profound changes in how we approach data. The first is to collect and use a lot of data rather than settle for small amounts or samples, as statisticians have done for well over a century. The second is to shed our preference for highly curated and pristine data and instead accept messiness: in an increasing number of situations, a bit of inaccuracy can be tolerated, because the benefits of using vastly more data of variable quality outweigh the costs of using smaller amounts of very exact data. Third, in many instances, we will need to give up our quest to discover the cause of things, in return for accepting correlations. With big data, instead of trying to understand precisely why an engine breaks down or why a drug’s side effect disappears, researchers can instead collect and analyze massive quantities of information about such events and everything that is associated with them, looking for patterns that might help predict future occurrences. Big data helps answer what, not why, and often that’s good enough.


このようなやり方で大量の情報を活用するにはデータのアプローチ方法を3方面で根本的に変えていくことが必要になる。第一に、たくさんのデータを収集し、活用することです。1世紀以上もの間、統計学者がしてきたように、少量のデータやサンプルでよしとするのではないのです。第二に、高度に加工されたきれいなデータを優先するのではなく、むしろ雑然としたものを受け入れることです。多くの状況で、ある程度の不正確さが許容されるようになってきています。これは、変動しやすい性質の膨大なデータを活用するメリットの方が非常に正確なデータを少量扱うことよりも上回っているからです。第三は、多くの事例で、物事の原因を発見するという探求をあきらめる必要が出てくることです。その代わりに相関関係を見いだすのです。ビッグデータでは、どうしてエンジンが故障したのか、どうして薬の副作用がなくなるのかと正確に把握しようとするのではなく、研究者は関連するあらゆるものや出来事について大量の情報を収集・分析して、将来的に発生することをある程度予測できるパターンを見出すのです。ビッグデータはWhat(出来事)を答えてくれますが、Why(理由)は答えてくれません。でもそれで十分なことがほとんどです。

事後的なアプローチよりも、予防的アプローチが重要だと最近は言われています。原発事故のような場合、その原因をしっかり把握するよりも、予兆を読み取って早めに対処する方がいいに決まっています。健康面においても、病気になってから治療に当たるよりは、そのような傾向がみられた段階で、病気にならないようにすることが大切になっているでしょう。そのような文脈でこの論稿を自分は理解していっています。

英語学習の点から言えば、一冊の本をしっかりと仕上げる、瞬間英作文で英語回路を作ることはもの凄い大切だと思いますが、以下のことも気に留める必要があるのです。

the benefits of using vastly more data of variable quality outweigh the costs of using smaller amounts of very exact data.
変動しやすい性質の膨大なデータを活用するメリットの方が非常に正確なデータを少量扱うことよりも上回っているからです


良い例か分かりませんが、カーティス教授が日本政治を語っている動画で、4分10秒あたりにEconomic stimulus(景気刺激策)の話題になりBridges to nowhereと言っています。



英語メディアに慣れ親しんだ人にはBridges to nowhereと聞いて「無駄な公共事業」を比喩的に語っていることが分かります。日本だと「誰も使わない高速道路」って感じになるでしょうか。英辞郎には雑誌で使われた表現としてありますね。

(英辞郎)
It is at least as valuable a flip of the financial pachinco balls as building yet another series of Shinkansen tunnels and bridges to nowhere, donating funds for the education of ex-Indonesian President Suharto's children, or assisting the development of totalitarian repression in China.
それは、財政のパチンコ玉をあっちこっちはじいて、どこか知らないが新幹線のトンネルや橋を架けたり、スハルト元インドネシア大統領の子どもたちに教育を受けさせるために献金したり、中国の全体主義的抑圧の発展に手を貸したりするのに劣らないくらいの価値はある。◆【出典】Hiragana Times, 1999年5月号◆【出版社】株式会社ヤック企画


こういうのは辞書には載っていない事が多いですので、精読オンリーの人はNo option is off the table=「テーブルに乗らない選択肢はない」的な読み違いをしやすいんですよね。

多読をしてきたかどうかの、歴然とした差は長い目で見た時に現れてきます。伊藤サムさんのやさしくたくさんの説明のときのグラフのようなものです。
yakudoku4.gif

最後になりますが、一冊の本をしっかりと仕上げる、瞬間英作文で英語回路を作ることはとても大切です。語学は体で覚える部分もありますからね、その一方で、多読は短期間で効果が現れず、スコアに直結しないためどうしても後回しにされがちです。たくさん触れる効用というものをもっともっと評価されるようになってもらいたいです。
スポンサーサイト



Comment


    
プロフィール

Yuta

Author:Yuta
FC2ブログへようこそ!




最新トラックバック



FC2カウンター

検索フォーム



ブロとも申請フォーム

QRコード
QR