「私はロボットではありません」
Googleに関連するサービスを使っていると、どこかしらでこんな言葉を目にしたことがあると思います。
特にブロガーはGoogleのsearch consoleでクローラーに「うちのブログ記事クロールしてくれや」ってお願いするときによく見るはず。
んで、何記事もクロール指示を出して、繰り返し同じような処理が続くようだとGoogle先生も「こいつ同じ処理何度もやりよるな……スパムウェアちゃうんか? せや! ほんとにロボットじゃないかテストしたろ!」となるわけです。
そこで僕が実際に出会ったロボット除外用の質問(ごく一部)は以下
- 家の画像をすべて選択してください。
- お店の外観の画像をすべて選択してください。
- 木の画像をすべて選択します。
- 食べ物の画像をすべて選択してください。
- 街区表示板のタイルをすべて選択してください。
んで、そんな画像が羅列されるわけだけれど、これがほんまにわかりにくい。
特に
- お店の外観の画像をすべて選択してください。
- 木の画像をすべて選択します。
- 街区表示板のタイルをすべて選択してください。
は極悪。
お前にはこの写真が店に見えるんか!?
っていう写真が対象に入ってるっぽいものもあれば、
これこそお店の外観やろ!?
みたいな画像も存在する。
木を選択!? この画像にも微妙に木ィ入っとるやんけ!
とチェックすると、どうやら不正解らしく「そこは柔軟にやっとけや」みたいな選択肢……
なんちゅーか、僕らがgoogleに教育されてる感じ。
極めつけは街区表示(道路標識)の写真なんだけど
こんなふうになってたりするんだな。(例です)
んで
「ふむふむ、この分割された画面の中で当てはまる部分をチェックするんやな」
ってことで、該当箇所をポチポチ押してゆく。
画面の分割具合的には、「2」とか「3」みたいに隣の区画にびみょぉ~~~~~~にはみ出てるものもあって
「天下のGoogleがはみ出た部分を見逃すはずないやろ!」ってことでそこもチェックすると、無事ロボット認定。
いや、そこ標識はみ出てるやん!
それも表示の一部でしょ!? と画面に向かって声を荒げるも出てくるのは次のチェック問題。
仕方ないので「Googleはこのはみ出た部分はチェック対象に入れないんだな」と学び、いい感じで無視するとようやく人間様として認めて頂ける。
え、なんなのこれは。
めんどくさああああい!
いやスパムとかね、そういうやつの対策っていうのはよーーーーーくわかってるよ?
でもめんどくさあああああああああい!!
まあ日々スパムウェアは進化しているから、簡単な認証じゃ破られるんだろうね。
人間がそこで面倒をこうむるのは自然な流れって事か……
しかし最近もっとすごい認証手段が出現していた。
- 街区表示を含む部分を囲んでください
なんと今までは区画された画像単位での選択だったのが、今度は一枚の画像を使って選択しなければいけなくなったのだ。(まだ一度しか出会ってないけど)
なんだこれ
もはやアドビのIllustratorのベジェ曲線に近いものを感じる。
認証にもお勉強が必要な時代に突入したか……
早速やってみるが自分がヘタクソなのか、ブラウザが上手く動作してないのかわからないが上手く選択できない。
結局数分格闘した挙句操作がわからなかったのでスキップした。
その次には画像選択式の認証パターンが……
難易度が戻ってくれてうれしいけど、意味あるのかこれ。幻か?
もくじ
スポンサーリンク
いずれGoogleは一人相撲をとるハメになる?
先ほどご紹介したロボット除外用のプログラム。
これらはなんだかんだでスパムアクセスの数を減らすことに大いに役立っていることだろう。
しかし、Googleはスパム対策を進める一方で、ロボットの「人間化」にも力を入れている。
最近よく耳にする「ディープラーニング」というヤツだ。
ディープラーニングとは?
「ラーニング(learning)」という言葉が入っているだけあって、学習をすることに他ならないのだが、一般的な機械学習と何が違うのだろうか。
機械学習は何かを判別する際、人間がその判別条件を機械に与える。
例えばりんごを判別するとき「赤いのがりんご」「丸いのがりんご」という条件を機械に与えることによって、機械はそれに合致するものをりんごと判別するようになる。
一方ディープラーニングは機械に「これがりんご」という例をいくつか見せることで、機械は「りんご」と言うものを理解・記憶し、少しくらい例に外れた形をしたものでも「これはりんごっぽいな」と判断する。
前者と後者の違いとして、前者は「赤い」「丸い」という条件から、さくらんぼまで「りんご」として判別してしまう。
後者は「りんご」と言う対象物を分析しているのでさくらんぼを前にしても「こんなに小さなものはりんごではない」と判断する。
これって、後者はまさに「人間的」な解釈。
バカにできないターミネーターの世界
その利用範囲としてまさに前述の「画像判別」が含まれており
ディープラーニングは物体認識を中心にさまざまな分野で活用されている。また、Googleをはじめとした多くのIT企業が研究開発に力を入れている。また、自動運転車の障害物センサーにも使われている[28]
GoogleのAndroid4.3[29]は、音声認識にディープラーニング技術を活用することで、精度を25から50パーセント向上させた[30]。2012年、スタンフォード大学との共同研究であるグーグル・ブレイン(英語版)(Google brain)は、1,000のサーバーの16,000のコアを使い、3日間で猫の概念を獲得し、話題となった[10][11]。この研究では、200ドット四方の1,000万枚の画像を解析させている。ただし、人間の脳には遠く及ばないと指摘されている[31]。GoogleLeNetと呼ばれるチームによるトロント大学との共同研究では、画像の説明文を自動で生成できる「Image to Text」と呼ばれるシステムを開発した。これは、コンピュータビジョンと自然言語処理を組み合わせ、ユーザーがアップロードした画像を認識し、説明文を表示するもの[32][33][34]。2015年3月、Schroffらは800万人の2億枚の画像を99.6%の精度で判定した(22層)[35]。
引用のとおり、脅威の識別率を誇るという。
まだまだ課題は多く、色々な学習を容易に行うことはまだ出来ないという欠点もある。技術者も少ないし
だがこのことから、現在はまだスパム対策として画像認証を行っているGoogleではあるが、この技術が本格的に実用化された暁には「ロボット除外用のプログラムをロボットが解除する」という因果応報な結果に繋がることだろう。
セキュリティ技術とクラッキング技術は昔からいたちごっこを繰り返していると言うが、ついにそこに自律型ロボットが参入する未来が見え始めたということだ。
人類逃げてー!!
生命とはなんだろうと考えさせられる話でもある
人間と機械、どちらが尊いか?
と言う話になった場合、今の時点では間違いなく「人間」と答える人がほとんどであろう。
しかしこのディープラーニングを含む、人間の脳みそに代わる技術が発展するにつれ、ますますその問題にまつわる壁は曖昧なものになってゆく。
まだまだ実現もしていないことだが、人間の形をした機械ができたとして、生殖活動、恋愛、摂食その他全てを人間のように行う機能が実装された時代に同じ質問を投げかけたら、「人間のほうが尊い」と答える人はどれだけ変わるのだろうか?
そこまでいってしまうと、もはや有機物か無機物かの違いであり、それは人間の言う「機械」とは違う別の生命と言うことになるのではないだろうか?
もしかしたら有機物の機構を備えた機械だって登場するかもしれない。
わぁ~、命って何だろう。命って不思議
そんなことを考えながら僕は今日もGoogleの画像認証に文句を言いながらポチポチやっているのでした。
エンド
コメントを残す