OL
ご近所のOLさんは、
先端に腰掛けていた。

vol.59
- semantic transcoding 2-


突然ですが、
今のインターネット(のコンテンツ)に
満足していますか?

え?なになに?

「英語が多いよ〜。」
「画面で読むのが苦痛です。」
「やたら文が長くて、読んでるヒマなどなーい。」
「一体、どの情報が正しくて、どれが正しくないのか
 わからなーい。」
「この文章は誰が書いているのー!? みたいな
  胡散臭いものが多いねー。」
「私の本当に欲しい情報はどこにあるのか、
 探すのに時間がかかり過ぎる!」

などなど…。
不満の声が届く、届く。
そーかー、我慢しているんですね、毎日。
わかる、わかる。

でも、何か解決策はないものか。

そんな問題をなんとかしてくれそうな
たのもしいA.I.(人工知能)技術が
前回から紹介している
セマンティック・トランスコーディング
なのです。

そして、そこに絶対欠かせないのが
アノテーションという技術。

★アノテーションはなぜ必要なのだろう?
★アノテーションは誰がつけるのだろう?
★アノテーションすることによって何が
 可能になるのだろう?

そしてアノテーションの極意は
「力を集める」ということ。
長尾さんとの話は
そんな展開へと…。

で、今日は
アノテーションをするということは
自分の文章に責任を持つということなんだよ
という前回の話の続きから始ります。

私の受けはなんだか「うん」とか「へーえ!」の
オンパレードになっちゃってますが、(笑)、
ただただアノテーションの威力に
感嘆しているだけなので
どうか気にせずに。

さ、さ、進みましょう。

アノテーションって何?


アノテーションエディタで処理した
結果サンプル
by Dr. Katashi Nagao
マーシャ うーん、けっこうツライ話だ…。
自分の文章に責任もたなきゃっていうのは。
でも、そりゃそうだね…(我が身を振り返り)。
ナガオ そう。
自分の文章に責任さえとってくれれば
それを読む人にとって、
ひじょうにありがたいことになる。
マーシャ はあ。
ナガオ だから、我々がそれを
いろんな形にトランスコードして
読むこともできるし、
意味的に踏み込んだ検索もできるし。
場合によっては、類似性ね、
つまり、特定の文章と別の文章の
類似性の判定にも使える。

その人の主張点がどこにあるんだっていうのは
従来の言われていることとの
差分をとればいいわけです。
で、そういうことが機械的にできれば
「ココ」をとにかく言いたいんだということが、
わかってくるわけですよ。
文章をきちんと書けばね。
マーシャ うん、うん、うん。
きちんと書かれていない文章については
何がいいたいのかは
すごい曖昧になりますね。
ナガオ だけど、きちんと書かれていなくても
アノテーションができれば
きちんとするんです、結果的に。
マーシャ そうか!付加的情報があればね…。
いいですねー。
ナガオ ええ(笑)。
文章そのものがきちっとしていなくても
アノテーションがきちんとしていれば
結果的には文章が、
きちっとしたことになるんです。
マーシャ ふーん、すごい。
誰がアノテーションするのか〜力を集める。
ナガオ その意味で、後付けでもいいんです。
だから、すでに亡くなっている人の文章でも
いいわけですよ。
マーシャ あっそうか…。
ナガオ オーサー(著者)がやるのが一番いいけど、
法律的にはね。
だけど、それがたとえできないにしても、
ちゃんとあとからアノテーションによって、
いい文章にすることはできるんですよ。
マーシャ へーえ。
ナガオ だからアノテータとオーサーが別の人でもいい。
マーシャ 例えば、夏目漱石の作品の
アノテーションを現在の人がやるいうことも
出来るわけですね…。
ナガオ そうそうそう。
世の中には、人、多いですからね。
こういう人たちの力を集めると
スゴイことになるわけですよ。


僕はそう確信してるんですよ。
だからwebを見てると…。
糸井さんのやってるのだって、ほら。
みんなで辞書を作ろうっていうような…ね。
マーシャ あー、コンピュータ用語辞典ね。うん。
『「ほぼ日」読者が寄ってたかって、
コンピュータ用語辞典をつくろう。 』

力が集まってますねー。
ナガオ だからそうやってみんなの知識を結集して、
大きなまとまった知識にしましょうって
いうことでしょ。
個々の知識は小さくても、
まとまると大きいよ!っていう。

もう辞書なんて、はっきり言って、
限られた国語学者とか専門家が編纂して
出版して出す時代じゃないと
僕は思うんですよ。
マーシャ 知識を集めていくんだ…。
ナガオ 言葉なんて生きてるわけですから、
ジャーゴン(専門語・業界用語)とか
そんなの沢山あるわけですよ。
そういうものをよく知っている人は
別に国語学者じゃなくたっていいし、
普通の人なんです。
マーシャ ええ。
ナガオ そういう人たちの知識を集めていくような
「しくみ」と「世界」を作りたい。
マーシャ だから、アノテーション!

何のためのトランスコーディング?
ナガオ でも、アノテーションと言ったって
みんな、その良さとかね、
なんでうれしいのかわかんないから。

だからトランスコーディングも一緒にやって
アノテーションとトランスコーディングを
一緒に流行らしていけば、
あなたのやっていることは
こういう意味がありますよ、って
見せられるんですよ。
マーシャ はい。
ナガオ それをやらないと、応用がなくて
知識だけ貯めましょうって言ったって
誰も何なのかわからなくて、
やる気がおこらないわけですよ。
マーシャ 何のために情報をどんどん流しているのか?
っていうことですね。
ナガオ ええ。
だから常に具体的な応用というか
何のためにやるのかを見せてあげる…。
それは、あなたの書いた文章が、いろんな
外国の人にも見てもらえるんですよ。
あるいは時間の無い人にも。
それから目の不自由な人にも。
マーシャ ええ。
ナガオ そういう人にも、ちゃんとあなたの
メッセージは届くんですよと。
そのためのトランスコーディングです、
とやるわけです。
つづく。
* * * *

トランスコーディングは
長尾さんが「壮大な野望の一つ」というように
だんだん壮大なビジョンが見えてきました。

最近よく耳にする言葉に
「情報格差」とか「情報弱者」とかいう
新しい用語がありますよね。

誰にでも優しいコンピュータと言ったって
やっぱり障害を抱えている人には
難しいことも多い。

あるいは、
インターネットは英語が主流なので、
どうしても尻込みしてしまう人もいる。

でも、「届けたい」「受取りたい」
という熱い想いが毎日毎日行き交っている
Webという世界。

トランスコーディングは、
A.I.技術を使って、
Web世界の「難しさ」を「優しさ」に変えて
その「想い」を届ける工夫が
満載されている技術だと思います。

それによって「格差」が縮まるとなると
いいですよねー。
理想的なパートナーなんだなぁ…。
うっとり。

次回は、webの歴史とか、
研究者の苦悩とかにまで触れる、
ちょっと深い話になりそうです。


marsha

2001-09-04-TUE

BACK
戻る