vol.59
- semantic transcoding 2-
突然ですが、
今のインターネット(のコンテンツ)に
満足していますか?
え?なになに?
「英語が多いよ〜。」
「画面で読むのが苦痛です。」
「やたら文が長くて、読んでるヒマなどなーい。」
「一体、どの情報が正しくて、どれが正しくないのか
わからなーい。」
「この文章は誰が書いているのー!? みたいな
胡散臭いものが多いねー。」
「私の本当に欲しい情報はどこにあるのか、
探すのに時間がかかり過ぎる!」
などなど…。
不満の声が届く、届く。
そーかー、我慢しているんですね、毎日。
わかる、わかる。
でも、何か解決策はないものか。
そんな問題をなんとかしてくれそうな
たのもしいA.I.(人工知能)技術が
前回から紹介している
セマンティック・トランスコーディング
なのです。
そして、そこに絶対欠かせないのが
アノテーションという技術。
★アノテーションはなぜ必要なのだろう?
★アノテーションは誰がつけるのだろう?
★アノテーションすることによって何が
可能になるのだろう?
そしてアノテーションの極意は
「力を集める」ということ。
長尾さんとの話は
そんな展開へと…。
で、今日は
アノテーションをするということは
「自分の文章に責任を持つということなんだよ」
という前回の話の続きから始ります。
私の受けはなんだか「うん」とか「へーえ!」の
オンパレードになっちゃってますが、(笑)、
ただただアノテーションの威力に
感嘆しているだけなので
どうか気にせずに。
さ、さ、進みましょう。
●アノテーションって何?
アノテーションエディタで処理した
結果サンプル
by Dr. Katashi Nagao
|
マーシャ |
うーん、けっこうツライ話だ…。
自分の文章に責任もたなきゃっていうのは。
でも、そりゃそうだね…(我が身を振り返り)。 |
ナガオ |
そう。
自分の文章に責任さえとってくれれば
それを読む人にとって、
ひじょうにありがたいことになる。 |
マーシャ |
はあ。 |
ナガオ |
だから、我々がそれを
いろんな形にトランスコードして
読むこともできるし、
意味的に踏み込んだ検索もできるし。
場合によっては、類似性ね、
つまり、特定の文章と別の文章の
類似性の判定にも使える。
その人の主張点がどこにあるんだっていうのは
従来の言われていることとの
差分をとればいいわけです。
で、そういうことが機械的にできれば
「ココ」をとにかく言いたいんだということが、
わかってくるわけですよ。
文章をきちんと書けばね。 |
マーシャ |
うん、うん、うん。
きちんと書かれていない文章については
何がいいたいのかは
すごい曖昧になりますね。 |
ナガオ |
だけど、きちんと書かれていなくても
アノテーションができれば
きちんとするんです、結果的に。 |
マーシャ |
そうか!付加的情報があればね…。
いいですねー。 |
ナガオ |
ええ(笑)。
文章そのものがきちっとしていなくても
アノテーションがきちんとしていれば
結果的には文章が、
きちっとしたことになるんです。 |
マーシャ |
ふーん、すごい。 |
●誰がアノテーションするのか〜力を集める。
ナガオ |
その意味で、後付けでもいいんです。
だから、すでに亡くなっている人の文章でも
いいわけですよ。 |
マーシャ |
あっそうか…。 |
ナガオ |
オーサー(著者)がやるのが一番いいけど、
法律的にはね。
だけど、それがたとえできないにしても、
ちゃんとあとからアノテーションによって、
いい文章にすることはできるんですよ。 |
マーシャ |
へーえ。 |
ナガオ |
だからアノテータとオーサーが別の人でもいい。 |
マーシャ |
例えば、夏目漱石の作品の
アノテーションを現在の人がやるいうことも
出来るわけですね…。 |
ナガオ |
そうそうそう。
世の中には、人、多いですからね。
こういう人たちの力を集めると
スゴイことになるわけですよ。
僕はそう確信してるんですよ。
だからwebを見てると…。
糸井さんのやってるのだって、ほら。
みんなで辞書を作ろうっていうような…ね。 |
マーシャ |
あー、コンピュータ用語辞典ね。うん。
(
『「ほぼ日」読者が寄ってたかって、
コンピュータ用語辞典をつくろう。 』)
力が集まってますねー。 |
ナガオ |
だからそうやってみんなの知識を結集して、
大きなまとまった知識にしましょうって
いうことでしょ。
個々の知識は小さくても、
まとまると大きいよ!っていう。
もう辞書なんて、はっきり言って、
限られた国語学者とか専門家が編纂して
出版して出す時代じゃないと
僕は思うんですよ。 |
マーシャ |
知識を集めていくんだ…。 |
ナガオ |
言葉なんて生きてるわけですから、
ジャーゴン(専門語・業界用語)とか
そんなの沢山あるわけですよ。
そういうものをよく知っている人は
別に国語学者じゃなくたっていいし、
普通の人なんです。 |
マーシャ |
ええ。 |
ナガオ |
そういう人たちの知識を集めていくような
「しくみ」と「世界」を作りたい。 |
マーシャ |
だから、アノテーション! |
●何のためのトランスコーディング?
ナガオ |
でも、アノテーションと言ったって
みんな、その良さとかね、
なんでうれしいのかわかんないから。
だからトランスコーディングも一緒にやって
アノテーションとトランスコーディングを
一緒に流行らしていけば、
あなたのやっていることは
こういう意味がありますよ、って
見せられるんですよ。 |
マーシャ |
はい。 |
ナガオ |
それをやらないと、応用がなくて
知識だけ貯めましょうって言ったって
誰も何なのかわからなくて、
やる気がおこらないわけですよ。 |
マーシャ |
何のために情報をどんどん流しているのか?
っていうことですね。 |
ナガオ |
ええ。
だから常に具体的な応用というか
何のためにやるのかを見せてあげる…。
それは、あなたの書いた文章が、いろんな
外国の人にも見てもらえるんですよ。
あるいは時間の無い人にも。
それから目の不自由な人にも。 |
マーシャ |
ええ。 |
ナガオ |
そういう人にも、ちゃんとあなたの
メッセージは届くんですよと。
そのためのトランスコーディングです、
とやるわけです。 |
つづく。
* * * *
トランスコーディングは
長尾さんが「壮大な野望の一つ」というように
だんだん壮大なビジョンが見えてきました。
最近よく耳にする言葉に
「情報格差」とか「情報弱者」とかいう
新しい用語がありますよね。
誰にでも優しいコンピュータと言ったって
やっぱり障害を抱えている人には
難しいことも多い。
あるいは、
インターネットは英語が主流なので、
どうしても尻込みしてしまう人もいる。
でも、「届けたい」「受取りたい」
という熱い想いが毎日毎日行き交っている
Webという世界。
トランスコーディングは、
A.I.技術を使って、
Web世界の「難しさ」を「優しさ」に変えて
その「想い」を届ける工夫が
満載されている技術だと思います。
それによって「格差」が縮まるとなると
いいですよねー。
理想的なパートナーなんだなぁ…。
うっとり。
次回は、webの歴史とか、
研究者の苦悩とかにまで触れる、
ちょっと深い話になりそうです。
marsha
|