人工知能(AI)とは「人の行う知的活動をコンピュータプログラムで実現すること」です。紺野,池谷(2021)は、「人工知能の定義は専門家でも定まっていない」と書きます。つまり、今のところ、人工知能は「賢いコンピュータ」と言えばいいのかもしれません。
紺野大地, 池谷裕二『脳と人工知能をつないだら、人間の能力はどこまで拡張できるのかー 脳AI融合の最前線ー』2021/12/16講談社
以下は、紺野,池谷(2021)に従って記述します。
「ディープラーニング」とは「大量のデータを与えることで、人口知能(高度なコンピュータ)が自らデータの特徴を発見するテクノロジー」のことです。
2012年「Googleのネコ」と呼ばれる印象的な出来事がありました。これは「人工知能がネコとはどういうものかを自ら『理解』した」という研究です。
この研究で、Googleの研究チームはまずyoutubeの動画からランダムに1000万枚の画像を集め、その画像をひたすら人工知能に学習させ続けました。ここで重要なのは「この動画に写っているのは人間で、こっちの画像にはネコが写っている」といった情報を人工知能に一切与えなかった点です。このような学習は「教師なし学習」と呼ばれます。(ここまで紺野,池谷2021,pp.56-57)
(1) まず1000万本のyoutubeビデオの中から1フレームずつ画像を切り抜きます。それをAI(賢いコンピュータ1000台)に読み込ませます(3日間かかった)。その中には「人間の顔が含まれているものが3%前後」「ネコはそれ以下」が含まれていた。
(2) それらの画像をAIが分類した。
その分類の中に「ネコ」と「人間の顔」もあった。
(どうやって分類したか)
AIは、数多くのドットとして画像を読み込みます。そのとき、数値化しています。種類よって数値が変わってくるのです。たとえば
Neuron1 → 100から200
Neuron2→ 100万から200万 とか
実際は、もっと複雑で9つの階層を経て、分類したのです。
AIが種類分けするときに「迷う画像」がある。それを数値化して、たとえば「0.55」「0.66」といった画像は自動的に数値を上げてやるようにプログラミングしておく。
様々な画像から特徴を総合して「1.0」になるものを決める。それを出力すると、上のようになった。