ChatGPTなど、AIがいつの間にか進化しており話題になっていますので、AIの進化について学んでいきたいと思います。
画像に関して
ChatGPT4も登場して、まさに「シンギュラリティー」と感じる方は、多いと思いますが、テキストによる自然言語処理と、音声処理に比べて、画像処理は、さらに難しさが上がります。
課題としては、
1.言語には正解があるが、画像はピクセルデータである。
2.画像はピクセルデータに意味がある。
3.画像には、「縦と横」の要素がある。
4.「画像分類」と、「画像生成」両方に課題がある。
ということかと思います。
ここで、AIが苦手な問題として、シンボルグラウンディング問題というのがあります。
シンボルグラウンディング問題とは
AIは、記号をシステム内のシンボルが、どのようにして実世界の意味と結びつけられるかわからに問題です。
人間は、「シマウマ」と聞くと、「シマ模様」の「ウマ」とわかるのですが、AIには、その概念がないため、「シマウマ」と言われても何かわからないという問題があります。
AIによる画像認識の進化に関して
画像認識の進化の歴史は、次のようになっています。
1990年代後半~2000年代初頭
最初の画像分類アルゴリズムが開発されました。これらのアルゴリズムは、手作業で特徴を抽出し、単純なパターンマッチングに基づくアプローチでした。
2010年代初頭
畳み込みニューラルネットワーク(Convolutional Neural Network)が登場しました。 CNNは、機械学習アルゴリズム自体が特徴を抽出することができるため、大きな注目を集めました。
2012年
深層学習の父と呼ばれるGeoffrey EHinton教授率いるチームの「AlexNet」が、当時最大の画像認識コンペティションであったILSVRC(ImageNet Large Scale Visual Recognition Challenge ) で圧倒的な優勝を果たし、CNNによる画像認識の可能性を広く知られるようになりました。
その後、GoogleNet、ResNetなど、様々なCNNをベースとしたアルゴリズムが登場しています。
AIによる画像生成の進化に関して
画像生成で一番重要なのは、「GAN(Generative Adversarial Network(敵対的生成ネットワーク)」です。GANは、Generator(生成ネットワーク)とDiscriminator(識別ネットワーク)の2つのネットワークから構成されており、互いに競い合わせることで精度を高めていきます。要するにAI対決です。画像生成は最近話題になってきました。
画像AIの進化
画像認識AIの進化は、
①パターンマッチによる画像認識
②畳み込みニューラルネットワークによる画像認識
③深層学習による画像認識
画像生成AIの進化は
①敵対的生成ネットワーク
という進化となっています。
画像認識AIは、パターンマッチから、各ピクセルを演算し、深層学習によるアルゴリズムへ進化。
画像生成AIは、Generator(生成ネットワーク)とDiscriminator(識別ネットワーク)のAI対決というように進化しています。
精度と応用が重要
画像認識AI、画像生成AIの進化について学んだと思います。
画像に関するAIは精度と処理速度が重要になりますが、顔認識やがん細胞の発見など様々な応用があります。
また、画像生成AIは、話題の「DALL-E2」や「Stable Diffusion」、「Midjourney」など新しいものがどんどん出てきます。
積極的に画像AIを活用して様々な応用を考えましょう!!
あとがき
AIによる画像技術の進化についてまとめました。
自然言語には、テキストと単語という正解があり、音声には、音と単語という正解があるのですが、
画像データは、ピクセルxピクセルのデータしか持っておらず、正解の画像もピクセルxピクセルのデータしかないため、正解を導くのが難しいというのが伝わればと思っております。
AIによる画像認識技術は、
①パターンマッチによる画像認識
②畳み込みニューラルネットワークによる画像認識
③深層学習による画像認識
というように進化しており、パターンマッチで良いものができた後、ピクセル情報レベルの画素に分解して、ディープラーニングを活用するという流れとなっておりますので、この技術も着実に進化していると言えます。
一方、画像生成AIの進化は
①敵対的生成ネットワーク(GAN)
を活用し、生成ネットワークと識別ネットワークにより精度が高まっています。すでにこの技術は古いと言われていますが、AI同士で精度を高めながら画像ができているのが素晴らしい技術です。
また、生成画像のレベルがかなり良くなっています。
個人的には、無料の画像生成AIの中で、「Stable Diffiusion」がおすすめです。機会があれば使い方を紹介したいと思います。
AIによる画像分類、画像生成技術は、様々な応用ができます。使い方をマスターし活用して行きましょう!!
コメント
Your post is a goldmine of information! It’s evident that a lot of research and effort went into creating this valuable resource. Great job!
Thank you for message!!
I’m glad to hear that.
I stumbled upon your blog and I must say, your post is fantastic! It’s informative, well-written, and easy to understand. Thank you for sharing your expertise!
Thank you for message!
I’m glad to hear that.