fc2ブログ

Uncharted Territory

自分が読んで興味深く感じた英文記事を中心に取り上げる予定です

RSS     Archives
 

コーパスを絶対視しない

 
連日暑い日が続いていますが、観測記録を冷静に捉えようとしているものがありました。お天気キャスターの森田さんが書いたものです。
「41度」日本記録への疑問
森田 正光 | 気象解説者/気象予報士/ウェザーマップ代表取締役
2013年8月14日 10時44分

ところで2010年9月、京田辺(京都)で、39.9度を観測したことがあります。
この時、地元の京都新聞の記者がアメダスを取材にいき、温度計に雑草(つた)が絡まっていることを見つけました。その後、この気温は雑草による温度計の不具合ということで、記録からは削除されました。

さて掲題の写真は、昨日(13日)市役所の方に撮影していただいたものですが、よく見ていただくと、アメダス周辺部はアスファルトや踏み固められた土に囲まれています。しかも、このアスファルト(駐車場)は、二年半前の2011年1月に舗装されたばかりだそうです。このアスファルトが、今回の高温に何らかの影響を与えている可能性はないのでしょうか。

気温などの測器が設置してある場所を「露場(ろじょう)」といいますが、地上気象観測法には、この露場は「芝草を植えて風通しのよい柵で囲む。芝草は時折刈り込み、雑草を取り除き地面の状態を一定に保つように維持する。」となっています。その意味では江川崎のアメダスは、この条件を完全に満たしているようには見えません。

今回の江川崎の場合は、高温記録が出たあとに気象台職員が検分に出向き、測器の不具合はないということで、この高温記録も正式発表になりました。しかしアメダスの設置ポイントとしては、最良の条件とは言い難く、周辺のアスファルトが気温の上昇に影響を与えたことは否定できないでしょう。


こういう測定記録はついつい結果だけを見て判断しがちです。でも測定方法が適切なものか考えることも重要です。

COCA のようなコーパスやtoeicの公式問題集のデータはついそのまましんじてしまいがちですが、そのデータの集計方法も考えなければいけないケースもでてくるでしょう。

例えば、toeicのパート7のダブルパッセージで骨董品のサーベルを買うようなやり取りがあったとします。様々な種類もあったので、saberという言葉が何回も登場したとします。頻度は多くなりますが、恐らくsaberなんて単語は、他の問題ではほとんどでないのに、DPで小道具として使われたために頻度は高いということが起きてしまうでしょう。(まあ、この問題を回避するには単語の使用回数だけでなく、問題レベルでの使用回数を導入することが必要になるでしょうか)

確かにコーパスは便利ですが、データ結果を盲信せずに扱っていくようにしたいですね。
スポンサーサイト



Comment


    
プロフィール

Yuta

Author:Yuta
FC2ブログへようこそ!




最新トラックバック



FC2カウンター

検索フォーム



ブロとも申請フォーム

QRコード
QR