fc2ブログ

Uncharted Territory

自分が読んで興味深く感じた英文記事を中心に取り上げる予定です

RSS     Archives
 

機械はI can’t believe it!をどう理解するのか?

 
「遺伝子操作→クローン人間」と飛躍してしまうように、人工知能と聞くと全知全能のシステムを想像しがちです。Wiredの最新号は人工知能の特集で比較的バラ色の将来を描いていますが、その一号前の『ことばの未来 「自然言語」をめぐる冒険』では言語理解の難しさをあげています。

画像や音声に比べて、言語に関する研究が進んでいないのには理由がある。それは一言でいうと「言語の特徴量を見つけるのが難しい」からだ。例えば、サッカーが上手な人に対して「あの人はヤバい」という場合と、お酒を飲んでベロベロになった人に対して「あの人はヤバい」という場合を考えてみよう。同じ「ヤバい」という単語でも、コンテクストによってまったく違う意味になっている。このように言語は捉えがたい性質をもっているので、たとえ大量のコンピュータをつなげたとしても、その特徴量を見つけ出すのは極めて困難なのだ。

これってまさに、新形式のTOEICのフレーズ理解の設問そのものですよね。機械に解かせるには、そんなに簡単ではないようです。

Have you two taken a look at the progress they’ve made upstairs on the office expansion? It looks great!
I know! I can’t believe it! And the offices up there have amazing views of the city.
2人は上の階でやっている会社の拡張工事の進捗を見てみたかい。すごいよ。
そうね。信じられないわ。それに上の階のオフィスだと街の眺めが素晴らしいの。

8. Why does the woman say, “I can’t believe it”?
(A) She strongly disagrees.
(B) She would like an explanation.
(C) She feels disappointed.
(D) She is happily surprised.


先週、国立情報学研究所の市民講座を受けてきて、改めて意味を理解することの難しさを実感してきました。

私たちは何を知っているのか
~暗黙の知識を紡ぐオントロジーとコーパス~
川添 愛


機械は賢くなったと言われていますが、機械の知性の向上と評価には人間の作った知識源が不可欠です。特に言葉の意味を理解するシステムを作る上では、辞書やオントロジー、アノテーション済みコーパスなどといった知識源の質が、その性能を大きく左右します。そして、質の良い知識源を作ろうとすればするほど、私たち人間はそもそも言語について何を知っているのか、またそれをどのように表現すべきなのかという問題に直面します。本講演では、言語理解のうち「言葉を使って推論をする」というタスクに焦点を当て、タスクの現状や、人間の知識を掘り下げて質の良い知識源を作るための試みについて紹介します。

にわか理解なので的外れな部分もありますが、機械がI can’t believe itを理解できるようにさせるにはアノテーション(注釈)をつけるという方法があるようです。ざっくり説明するとメタ情報として以下のように意味を盛り込むそうです。

I know! I can’t believe it<注釈She is happily surprised.の意味>! And the offices up there have amazing views of the city.

ある程度機械的にアノテーションをつけられるそうですが、やはり最終的には人間の手によって直す必要あるとか。機械的につける方法は、今回の例だったら、前後にamazing viewのようにポジティブな表現があるから、She is happily surprised.の確率が高いのように判断する感じでしょうか。

I know! I can’t believe it! And the offices up there have amazing views of the city.

英語学習ではすぐに文法批判、辞書批判が沸き起こりますが、コンピュータが文章を理解するには文法理解、辞書の整備などは欠かせないものであるようです。

あと、オントロジーという体系的理解も欠かせないようです。オントロジーというと難しい感じですが、TOEIC学習者にはおなじみのguitarの上位語はinstrumentのように属性なども含めた体系的な理解のようです。先日FTを取り上げたました。そこでsame pink FTとありました。

New owners, new partners, same pink FT

ここでpinkの意味を理解するにはFTの紙面はpink色だという属性を知らないといけないでしょう。そういった感じの全体的な理解をオントロジーというようです。

興味がある方のために過去の講座で似たようなトピックのものをご紹介します。このブログでも以前取り上げさせてもらったものです。

2012年1月18日(水)
言葉の意味を処理するとは?
コンピュータで言葉を理解する 宮尾 祐介


▼ 概 要
言葉を理解するとは言葉の意味を理解すること、と我々は思っています。しかし、そもそも言葉の意味とは何なのか。「のび太はごはんを食べている」という文を聞いたとき、ある男の子が食事中で風呂場にはいないことがなぜ分かるのか。コンピュータにこのような意味理解をさせるためには何が必要なのか、最先端の研究を紹介します。


もちろん人間と機械の理解の仕方を同一視できませんが、外国語を意識的に学んでいる我々にとって意味を理解するのに必要なことを意識するのは悪いことではないと思います。
スポンサーサイト



Comment


    
プロフィール

Yuta

Author:Yuta
FC2ブログへようこそ!




最新トラックバック

月別アーカイブ


FC2カウンター

検索フォーム



ブロとも申請フォーム

QRコード
QR