雑種路線でいこう

ぼちぼち再開しようか

フィルタリングの未来

方々で誤解があるようだがネットスターって意外とちゃんとしているよ。問題がドコモがフィルタリングに疎くて正しい運用の仕方を知らず、全てのデータをブラックリストとして適用してしまったことだ。これも彼らに悪意があった訳じゃなくて、昨年12月の大臣要請以降のドンチャン騒ぎってか七転八倒の過程で、勉強する余裕もないままホワイトリストじゃ駄目でブラックリストにせい、とか、いろんな不幸が重なってのチョンボに過ぎないんだから、大目に見てやってやれよという気がする。それはさておき小倉先生の提案だが、僕も群衆の英知をフィルタリングに活用する、即ちソーシャル・フィルタリングみたいな考え方はありだな、と考えている。

ネットスター社のフィルタリングが不十分なのであれば,「先進的なネットユーザー」たちで独自にフィルタリングソフトを開発すれば良いではないかという気もします。ホワイトリスト方式にせよ,ブラックリスト方式にせよ,人海戦術が求められるわけですが,人海戦術こそ,Web2.0の強みの一つだったはずです。

すごく簡単にいうと、はてブで「18禁」とかタグの打たれまくったコンテンツはフィルタしましょう、みたいな。id:hashigotanがたまに書く発情エントリとかには効果絶大な気がするんだが、きっとイタズラに使われてフレームになった時に、ちゃんと評価が均衡するかは不明。あと、ブクマとかデータの公開が前提となるので、利用者がそのタグをクリックした途端に却って違法行為とか有害コンテンツ閲覧を助長するんじゃないの、という考え方もある。そこに対するひとつの回答が、コミュニケーション・カウンセラーの資格制度化なのだが。という訳で解決すべき課題もあるが、ネットスターでも数十人でレイティングしている訳で、数万人の利用者を抱えるソーシャルブックマークが群衆の英知でフィルタリングすれば?ってのは全くその通り。ただMiAUは圧力団体であって、フィルタリングでも何でもプロジェクトを運営する体制にはなっていない気がする。それ以前に闘うネタ多すぎだしさ。
まあドコモの件なんか代表的だけど、超優秀なはずのドコモ社員でさえ運用にチョンボして自民党伝統宗教まで弾いてしまったフィルタリングを、平均的な知性レベルの保護者に正しく運用しろって方が、そりゃあ建前はそうだけど現実的じゃないよね、という話はある。だから、デフォルト設定をどうするかというのは意外と重要だ。まあこの辺って時代の空気もあって、Windows Updateとかも昔はOSが勝手にネットに繋ぎにいって自身を書き換えるとは何事か!みたいな議論だったのが、Blaster以降はデフォルト設定でOSが安全に運用できないとは何事か!と変わった訳でありまして、それなりにフィルタリングが普及した段階で、もうちょっと議論が落ち着いてくる気がする。まあ、制度論を考える上では些末な議論でしかない。たぶん、ソーシャルブックマークに於ける特定のタグを違法有害情報の通報手段として利活用するのは、そう遠い話ではないだろう。
というかフィルタリング技術に於いてURLデータベースなんか、かなり過去の技術になりつつあって、Windows Vistaのフィルタリングで半分以上は機械学習になっている。人手によるレイティングは辞書を鍛える為と、もちろんフィルタリングにも使っているが、URLブラックリストじゃAjaxに対応できないし人手で登録していくのがとても間に合わないので、半数以上は機械学習で引っ掛けてデータベースに登録している。イメージ的には、検索エンジンに於けるYahoo!ディレクトリからAltavistaGoogleのロボット方式への変化が進みつつある。そうなると法案の書きぶりとか規則の一字一句なんて基準でしかなくて、現実にはアルゴリズムの水準で何をどうブロックするの?ってことの方が遥かに重要だ。
僕がセルフラベルを推してきたのも、セルフラベルが数割も普及しないのは織り込み済みで、けれども数%であっても良質な手動レイティング情報があれば辞書を鍛えられる、という期待もあった。セルフラベルにせよソーシャルレイティングにせよ、精度としてはかなり嬉しいし、わざわざPICSでFeedしなくとも、数年もすればボットが勝手にソーシャルブックマークの情報を拾ってメタデータとして活用することが当たり前になるだろう。そういう意味じゃ、人手に頼った伝統的フィルタリング事業者というのが、数多あったディレクトリ事業者のように淘汰されてしまうのか、というのは考えておくべきことだ。
僕はロボット式フィルタリングでは検索エンジン各社しか残らないと思っていて、フィルタリングソフトベンダの生き残りは、辞書を鍛えるとか、隠語の流行に追随するとか、ネットいじめを仲裁するとか、そういう人手のかかる部分のアウトソーシングと、情報提供のライセンシング・ビジネスが主体になるんじゃないかという気がする。そういう意味でも、実は有害コンテンツ規制を巡る状況って情報大航海プロジェクトを立て直して年間数十億の予算をもっと派手な成果を出せそうなところに使う千載一遇のチャンスだったのに、センスないなあとか嘆いても仕方ない。
まあMiAUがフィルタリングソフト事業者になることは120%ないと思うけど、小倉先生の考えていることが、実は意外と時代を先取りしていたので、ちょっと驚いて思わずエントリしてみた。僕も気負って仕事してるけど、やるべきことって結局誰かが既にやってるんだよね。ただ、先頭集団と走れそうな時期に損得考えずに汗をかくというのは、いろんな意味で勉強になるよね。そう信じてる。