最大のメディア「言語」の力は, 簡単に表現できない 福本 淳一

最大のメディア「言語」の力は, 簡単に表現できない 福本 淳一
情報理工学部 メディア情報学科 福本 淳一 教授
単元に関係するキーワード 情報「コンピュータと情報の処理」,「情報の蓄積・管理とデータベース」

「サッカーワールドカップで優勝したのはどこ?」と,私たちはわからないことを他人に聞き,その答えを見つけます。しかし,聞かれた人はどのように正解を見つけ,それをどう言葉に表現しているか,考えてみるとふしぎなことがたくさん見つかるのです。

わからないときは,質問する

情報理工学部 メディア情報学科 福本 淳一 教授携帯電話に質問すると,答えが返ってくるようになりました。質問されると,コンピュータは質問文を分析し,次に検索をして回答を見つけ出します。たとえば{サッカー,ワールドカップ,優勝}をキーワードに検索し,これらと一緒に使われる頻度の高いものや,文章内で距離の近い単語を,回答候補とします。そして“,どこ=国”に対応できるように,国名だけを抽出していくことで結果となるのです。
しかし,私たちにも身に覚えがあるように最初の質問では回答を絞り切れないことがあります。
A「サッカーワールドカップで優勝したのはどこ?」
B「いつの大会?」
A「2014年だよ」
B「それなら,…」
福本先生は,こうした対話を応用して新しいシステムに実装しました。

曖昧な質問を補完する

最初の質問では,いつのワールドカップか判別できません。そこで,質問を返して補う新しいシステムを先生は考えました。
コンピュータがキーワード検索を行うと“,2014年の”や“(2014)”が前後に付いたワールドカップの表記が多数見つかるため,そこから,「2014年のワールドカップですか?」と質問を返すことができます。正しければ「はい」,違えば「いいえ」と答え, 「いいえ」であれば2014年の次の候補を使い,また質問を返します。「はい」であれば,最初にユーザが入力した質問と,システムが返した質問を合わせて,検索キーワード{サッカー,ワールドカップ,優勝,2014年}をつくり,答えを見つけます。
コンピュータが言語を扱うためには,こうしたひとつひとつの丁寧な言語処理が必要なのです。さらに,先生は表現にも研究範囲を広げ“甲子園球場30個分”といった数量を表す比喩表現なども処理を試みています。

fukumoto_i

まだまだわからない,人と言語の世界

「言語だけをやっていてもおもしろくない」という先生は,最近マンガにも注目しています。扉の絵の横に「バタンッ」と書くだけで,私たちは“閉じた”ことを読み取りますが,「バタンッ」は本来,単に音を表す擬音語です。それが,絵と組み合わせることで「閉じる」という意味を持つからふしぎです。
「ロボットに何かしゃべらせたい」と研究をはじめた先生ですが,その中で人と言語の世界にはまってしまいました。言語という最大のメディアを私たちは自然と使いこなしますが,それは本当に奥が深いものなのです。