EXEイベント #12 ブロックチェーンとAI/機械学習が生み出す相乗効果(後編)

2018年7月23日 2018年7月26日

Blockchain EXE

デイスカッション | ブロックチェーンとAI/機械学習が生み出す相乗効果

石井例えばよくAI論文にある数式っていうのは、脳の仕組みをこの数式に合わせるとこれに近いんじゃないかっていう話ですよね。対してブロックチェーンは憲法みたいなもので、法則がしっかり書いてある、追っていけばいつかわかるみたいな話で、そこは全く違うからこそ相乗効果があるんじゃないかと。今回の話で、僕はAIとの掛け合わせで思っているのが、ざっくりとふたつあると思ってます。一つはAIとブロックチェーンの組み合わせによってデータの信頼性を上げるということができるというのと、もう一つはデータの質を上げるということができると思っているんですけれども、信頼性と質について、AIとブロックチェーンについて、皆さんはいかが思われますか？

松本 AIとブロックチェーンの話でひとつ僕らが認識しておかなければいけないのは、ビッグデータの信頼性って監査できないと思っています。例えば、1TBの数十億行のログデータを数行だけ悪意のあるログを混ぜてあるものをどうやって監査するんだっていう問題があること。それとこれは未だに研究としては最先端にある内容なんですけれど、例えばディープラーニングで作られたモデルについては非常に複雑なモデルになっていて、それが間違っているのか悪意を持った学習になっているのかどうかというのは、実はモデルから解釈することはできない。

モデルから解釈できる機械学習的なアルゴリズムというのもある程度はあるが、非常に簡易なアルゴリズムに絞られてきていて、簡単な回帰分析みたいなレベルになってきているのかなと思っているし、なんらかの次元圧縮を加えたようなデータをインプットにしてる場合はもはや人間に解釈不可能になってしまっているケースが多いと思うんです。どうモデルを解釈するのかといった点も、それを監査するという意味では必要なのかなと思っています。それが担保されて初めてブロックチェーン上で機械学習モデルの監査みたいなところがうまくできるようになるのかなと思っていて、なので問題としてはそこが始めなのかなと思っています。

Jim ブロックチェーンの特徴は基盤になれることや、複数のユーザーがブロックチェーン経由で情報を交換したり支払したり、認証したりすることだと思います。AIの場合にもマイクロペイメントの支払いや、この世界の事実を信頼できるプラットフォームとして使う価値があると思います。

石黒その点に関しては、最後のほうに少し言ったTCR、Token Curted Registry、今クーガーですごく研究しているんですけれども、そういった技術を使えばある程度は良くなるんじゃないかと思っています。ざっくり言うと、「この人はいいデータを出す人ですよ」というような形でみんなが投票していく。かつそのデータから生まれたモデルというのはある程度精度が高いんですと」もっと言うと、精度が高いのは常に全員にとっていいわけではなくて、僕にとってすごくいいモデルであればいいわけです。各々求めてるモデルは違うので、リスト化をしてみんなでvoting（投票）をしていく。そういうようなガバナンスを含めてやっていけば、ある程度良くなっていくんじゃないかなと思います。

悪意のあるノイズデータ問題

松本ちなみにAdversarial Machine learningみたいな課題に対してどう思います？たとえば僕が嫌いな会社のデータだけが捻じ曲げられるようにこっそり仕込むことができて、それは一般的な99%の人にはわからない。僕はそこをどうやって解決したらいいかすごく悩んでいてます。

石黒それであったら、自分はそのグループを抜けて、自分で新しい正しいと思えるグループを作って、その中で正しいモデルを生成していけばどうでしょう。要は一種の村社会って感じで、全員が全員そのモデルを使う必要は無いと思っていて、そういったやり方もあるんじゃないかなと思います。

石井学習で考えると、まあ意図的な悪意もありますけど、本人は何も思ってないけど単純な間違いが入ることもありますし、AIの学習じゃない前段階のインプットデータのチャックで、ある程度はレベルは担保できると思うんですけど。ブロックチェーンの話で完全主義みたいな話をやり始めると、実はそこまで完全ではないみたいな感じはありますね。

茂谷さっき石黒さんが発表されていたAIの学習履歴っていうのは、どういうデータによって、どういう学習がなされたのかをトレースできるっていう内容なんですよね？トレースできるんであれば、悪意を持って変なデータを学習させるみたいのだって後でわかるわけですよね？

石黒そうですね。今日見せたものだと事後報告みたいになっちゃうんですけれども、実際モデルを正しく動作している時代に戻しましょうっていうロールバック機能が実はそこに付いていて、正しいデータで正しいアルゴリズムで学習したデータに戻しましょうと。そういう機能をつけたことで、悪意のあるデータを使ったモデルは排除していくようにできると思っています。

石井インプット問題っていうのがブロックチェーンにはあって、インプットがゴミだとゴミのままいくんですけど、ただインプットがゴミだったことさえも残っているので、それがまずひとつ抑止力になっていくっていうのがあると思うんですよね。ミスがやたら多いとか、意図的に変なことやってるのも残るっていうのがまずひとつあると思いますけど、松本さんの話でひとつ次元を上げると、それすらわからないような巧妙なやつはわかんないなっていう話です。

極端な例ですけど、為替相場のシステムがあるじゃないですか、仮に処理を0.01秒意図的に遅らせた処理が既に今入ってるかもしれなくても、それはわかんないですよ、そういうレベルですよね。

松本そうですね。あとは例えば記事のリコメンドを僕らはやっているので、気をつけなきゃいけないと思ってるのは中立性で、右に寄った記事・左に寄った記事を偏らせて配信することに対して我々は責任を持たなければいけないと思っています。それをどうやって担保するのかっていう、ある意味で内政干渉的な意味でのadversarial machine learningみたいなカテゴリーがあるのかなと思っていて、フェイクニュースなんかも近いですね。

茂谷今Gunosyではどうやっているんですか。

松本僕らのところではマシーンラーニングのアルゴリズム自体に全く偏りを入れないようにっていう話はしていて、ただそれは僕らの観点での「偏りがない」なのであって、理想的には例えばそれが非中央集権化できるのであれば、より公平なアルゴリズムが生まれる可能性があるかもしれないですね。

茂谷ということは、ユーザーはGunosyを信頼しなきゃいけないてことですね。

松本そうですね、Gunosyであってもスマートニュースさんであっても全部僕らを信頼して配信しているってことなので、現状はどのニュースソースを使うかはユーザーが選ばなければいけないということで。どの会社もですけれどフェイクニュースをどうやって機械学習的にはじこうとか、そういう取り組みをcentralizeするアルゴリズムっていうのをやっています。centralizingのいいところは、敵対的な学習を加える余地は無いので、我々を信頼していただける限りにおいては、我々は最善のものを提供する、それが結果として株価に反映されたり売り上げに反映されるわけで、我々はそこにインセンティブがある、これは資本主義のよくできた仕組みかなあと思います。

ConsenSysでのAI×Blockchainサービス

石井 Jimさん、ConsenSysで、AIとマシーンラーニングで進んでるもしくは進めようとしているプロジェクトとか傾向とかって何かありますか？

Jim 機械学習よりTCRのほうが流行っていて、そのひとつの例にadChain、広告会社向けの質の高いWebサイトのリストがあります。。もし自分のWebサイトを投稿する場合にはデポジットを入れて、自分のWebサイトが不正アクセスがないように制限している。もしbotが自動的にクリックを繰り返したりすると、捕まったら自分のデポジットがなくなる。まずトークする際にはデポジットを入れることにして、そのおかげでだんだんコミュニティの質の高いWebサイトを登録管理できます。

もうひとつ面白いのはfacebookが自分のWebサイトを登録して、誰かがfacebookは良くないと判断してコミュニティが投票してそれがなくなった。投票の仕組みで選ばれているから、政治的な判断になっちゃったわけ。そういうパターンはだんだん増えてくると思いますね。

石井 wikipediaの進化版みたいな。

茂谷トークンのメカニズムデザインがアメリカとかドイツで流行っているじゃないですか。さっきのadChainの話もそうだと思うんですけど、その設計の仕方がすごく合理主義的というか、みんな金欲しいんだろう、金欲しいんだったらそういうふうに動くだろうみたいな、単純化された個人の前提に立っているような気がしています。

例えばBitcoinであればマイニングする目的って敢えて設定してなくて、マイニングの処理を、コンピューティングパワーをもっとゲノムの解析に使いましょうみたいな話があります。そうしたら無駄にならないじゃないか、社会貢献できるじゃないかというような話がある中で、敢えてあれを無意味にしていてます。その理由は、「神の創った世界だからゲノムの解析なんかするんじゃないよ、この世界ぶち壊すから」みたいなモチベーションを持ってる人が参入して、Bitcoinのインセンティブのメカニズムをぶっ壊すみたいな、そういう発想があると思います。モチベーションがそういうお金だけじゃなくて、インセンティブだけじゃなくて、もっと多様なインセンティブを持った個人を前提にしないと危うい世界になるんじゃないかと。TCRとかキュレーションマーケットとかは面白い発想ではあるんですけど。言い方悪いですが、ものすごく短絡的な目先のメリットでみんな動くだろみたいな前提に立ってるよなって感じます。

松本その領域については、そもそもパブリックブロックチェーンの話っていうのは人間が経済合理的な動物であるっていうのを前提に作られていて、それがひっくり返しうる幅があるんですよね。そのコンセンサスのセキュリティレベルの設計になってくるのかなと思っていて。例えば明らかに非合理的な人間が10人いるだけで崩壊するケースと5億人いないと崩壊しないケースっていうのがあると思っていて、それは例えばプルーフ・オブ・ステークみたいなアルゴリズムだと、51％攻撃をやるために全体の時価総額のトークンの51％を握らなければならない、その51％がいくらかっていうのでそのセキュリティの強度は変わってきて、それが充分に大きい限りにおいてはワークしている、小さい限りにおいてはそもそもcentralizeをやるべきだと僕は思っている。その広告のケースについては基本的には全員が経済合理性を求めて広告をサイトに載せているし、それがきれいなサイトだっていうのを証明することで売り上げが上がり得るのが見えているからこそやるっていうので、adChainていうのはすごく面白いプロジェクトだと僕は思っています。

会場からの質疑応答

質問者 さきほど松本さんから、GDPRがブロックチェーンにとって良くないのではないかという話がありましたが、それはどういう理由なんでしょうか。僕はGDPRがブロックチェーンのようなものを促進する面もあるのかなと思っていたのですが。

松本　現実的な話をすると、GDPRの規則っていうのは、誰がどんなデータを持っているかを提出させる権利だったり、自分の持っているデータを渡す時に権限を与えなきゃいけないし、さらにそのデータについては削除する権利が必要であると。どういうデータを持ってるのか見えなきゃいけない。ブロックチェーンで難しいのはすべての履歴がパブリックに残っていくので、自分のデータを一度記録してしまったら削除できない。それが特定の団体によってリリースされたものであれば、その団体に対して最低でも12億円の罰金がかかってくる。これは例えばcentralizeだって言い張っても、法的にはそのコントラクトをデプロイした人間が最終的には主体と見なされると僕は思っていて。ここはEU圏の法律に詳しい人間に聞くのが一番いいと思いますけど、僕としてはそういうふうに解釈しています。ということで相性が悪いと思っています。

Jim GDPRにはものすごく詳しいわけではないですけれど、削除するよりもし自分がプライベートキーを管理するなら、誰にも読んでほしくない場合、自分のそのキーを捨てるかあげないことでできるかもしれない。だからfacebookみたいな中央集権的なシステムより、自分の認証IDのデータがブロックチェーンに保存されたら、自分で判断してあげる人がいれば暗号キーを渡せば良い。ある程度GDPRの従来のシステムより良くできると思います。

松本企業サイドというかサービスサイドと個人サイドというところで、個人サイドにはものすごくメリットがあると思っていて、Jimさんの個人サイドのお話は自分のデータのアクセシビリティに対して自分の権利をもって主張できるようになる。これはすごくいいことだと思っていて、企業サイド側で収益を上げづらいっていうのはGDPRと相性が悪いと僕が言っているところの真意かなと思っています。