
- 1 生成AIとは
- 2 生成AIの歴史
- 3 生成AIの現状
- 4 生成AIの今後
- 5 生成AIの特徴
- 6 生成AIのメリット
- 7 生成AIのデメリット
生成AIとは?
学習したデータを基にテキスト、画像、音声、動画など新しいデータを生成するAIの総称です。
生成AIは「Generative AI(ジェネレーティブエーアイ)」とも呼ばれており、代表格のChatGPTやStable Diffusionなど人間が作ったような精度が高いデータを生成できるのが特徴です。
ディープラーニング(深層学習)という大量のデータからAIが自動で特徴を抽出する機械学習モデルの1つを活用しています。
生成AIの歴史
AIの歴史は古く現在の生成AIに至るまで大きく3つのフェーズに分かれております。
1960年代は第1次AIブームとなり、IBMが開発したメインフレームと呼ばれる企業用の大型コンピューターが格企業に導入されたり、世界初の対話型AI「ELIZA(イライザ)」が誕生し話題となりました。
コンピューター導入より単純計算の高速化など人間が設定したプログラムを基に正確な回答を抽出する用途で活用されていました。
1980年代は第2次AIブームとなり、エキスパートシステムというAIのプログラムが注目され期待が高まりました。
エキスパートシステムにより格分野において専門的な回答が導き出せることで、AIの専門分野での活躍が期待されていましたが、まだ回答の正確度も低く最終的に人間のチェックが必要なため、AIに膨大なデータを学習させて管理して活用するには費用対効果が悪くブームも消え去りました。
そして2000年代から現在に至るまでを第3次AIブームとなります。
AIの技術向上によりビックデータという膨大のデータからAIが自ら学習して規則性を見つける機械学習が可能となりました。
さらに機械学習モデルの1つとしてディープラーニング(深層学習)というより高精度な学習ができるようになったことでAIの技術が向上しました。
2014年にモントリオール大学に在籍していたイアングットフェロ氏が生成モデルのアルゴリズム「GAN(Generative Adversarial Network):敵対的生成ネットワーク」を発表し、主に画像生成に活用されその後の画像生成モデルに影響を与えました。
2015年に現OpenAIのCEOのサム・アルトマン氏やTeslaのCEOイーロン・マスク氏やPayPalの創業者ピータ・ティール氏などが支援し非営利研究機関として「OpenAI(オープンエーアイ)」が設立されました。
2017年にGoogleが深層学習モデル「Transformer(トランスフォーマー)」を開発しました。
Transformerは従来の深層学習モデルと比較して機械学習の速度が速く、この特徴を活かして速くて精度が高い自然言語処理ができるようになり、その後様々な大規模言語モデルに活用されるようになります。
この時期から生成AI関連の開発進み様々な技術が開発されました。
「大規模言語モデル(LLM:Large Language Model)」は大量のデータとディープラーニングを活用して構築された言語モデルです。
2018年10月にGoogleがTransformerをモデルにしたLLM「BERT(バート)」を開発、同年6月にOpenAIがTransformerをモデルにしたChatGPTのベースとなるLLM「GPT」を開発、2019年2月に「GPT-2」を開発しました。
10月にはGoogleがBETRとは抽出方法が異なる新たなテキスト生成モデル「T5」を開発しました。
2020年
2020年1月にGoogleがAIチャットボット「Menna(ミーナ)」、OpenAIが5月にGPT-2を改良したLLM「GTR-3」をリリースしました。
GTR-3は旧モデルと比較してパラメーター数が拡大に上がり学習精度が高くなりました。
2021年
2021年1月にOpenAIがGTR-3を応用して画像生成モデル「DALL-E(ダリ)」をリリースしました。
5月にGoogleがLLM「LaMDA(ラマダ)」、9月に検索アルゴリズム「MUM(マム)」をリリースしました。
生成AIの現状
2022年に画像生成AIの「Midjourney(ミッドジャーニー)」や「Stable Diffusion(ステーブル・ディフュージョン)」が無料で一般公開されたことで、世界中のユーザーが簡単に様々なクリエイティブな画像やイラストを作成できることで話題となり、SNSで様々な生成AIの画像やイラストが投稿され盛り上がりました。
特に生成AIブームとなったキッカケがOpenAIが同年に無料で一般公開した「ChatGPT(チャットジーピーティー)」になります。
ユーザーの様々な質問に対してAIが自ら考えて人間のような回答をしてくれる技術に驚き世界中で話題となり公開して1週間以内でユーザー数が100万人を達成するなど生成AIブームとなりました。
ChatGPTは日常生活の中で活用する機会もあり、仕事の業務効率化などビジネス上での活躍も期待され社内に導入する企業も徐々に現れました。
ChatGPTの誕生により第4次AIブームとなり大手企業の生成AI市場の覇権争いも加速しています。
2022年
2022年4月にGoogleがLLM「PaLM(パーム)」、OpenAIが画像生成モデル「DALL-E2(ダリツー)」をリリースしました。
7月にアメリカのベンチャー企業Midjourneyが画像生成AIのMidjourney、8月にイギリスのベンチャー企業Stability AIが画像生成AIのStable Diffusionを無料で一般公開しました。
11月にはOepnAIがテキスト生成AIのChatGPTを無料で一般公開しました。
ChatGPTはGPT-3.5の技術を活用しておりGPT-3をアップデートしたものになります。
2023年
2023年2月にマイクロソフトが自社の検索エンジン「Bing(ビング)」にLLM「Bing AI(ビングエーアイ)」を無料で一般公開しました。
Bing AIにはGPT-4も活用されています。現在はBing AIは「Copilot(コパイロット)」に名所変更しています。
同じく2月にGoogleが自社の検索エンジンにLLM「Bard(バード)」を無料で一般公開、Metaが2月にLLM「LLaMA(ラマ)」、3月にOpenAIがLLM「GPT-4」を一般公開、5月にGoogleがLLM「PaLM2(パームツー)」、7月にMetaがLLM「Llama2(ラマツー)」、9月にOpenAIが「DALL-E3」をリリース、Adobeが画像生成AI「Adobe Firefly(アドビファイアフライ)」を無料で一般公開しました。
11月にOpenAIがLLM「GPT-4 Turbo(ターボ)」、xAIがLLM「Grok(グロック)」をリリースしました。
2024年
2024年2月にGoogleはBardを「Gemini(ジェミニ)」に名所変更しました。
4月にMetaがLLM「Llama3(ラマスリー)」、5月にOpenAIがLLM「GPT-4o(オムニ)」、7月にGPT-4oのコンパクト版のLLM「GPT-4o mini」、11月にxAIがLLM「Grok-2(グロックツー)」をリリースしました。
生成AIの今後
生成AIブームを作ったChatGPTやMidjourney、Stable Diffusionなどはベンチャー企業がリリースしており、大手企業が一歩出遅れ次々に生成AIをリリースしました。
ChatGPTリリース後すぐにマイクロソフトが自社の検索エンジンに搭載したBing AI(現:Copilot)をリリースしました。
この一連の状況に焦りを見せていたのがGoogleです。
ChatGPTも元々はGoogleの開発したTransformerという深層学習モデルをベースに作られていたのですが結果OpenAIに先を越され、検索エンジン業を展開しているマイクロソフトに出遅れる形になりましたので、事業に対する深刻な脅威としてコードレッドを発令しました。
2023年にGoogleは検索エンジンに搭載したテキスト生成AIのBard(現:Gemini)をリリース、メタバース事業に注力していたMetaも生成AI事業にフォーカスすることを発表し2023年にLlama2(現:Llama3)をリリースするなど日々続々と大手企業やベンチャー企業が生成AIを開発しリリースしております。
2024年入り各社の生成AIの開発の勢いは加速しており機能面も向上しています。
特に大手企業のGoogleやマイクロソフトが巻き返しており、ビジネス上での活用機会が増えています。
OpenAIはウェブブラウザの開発を検討しておりChatGPTとの連携を構想しているようなので、Googleとの競合関係も激しくなります。
また国内でも多数の大手企業が生成AIの開発を発表しておりますので、国産の生成AIが誕生することで日本語対応など国内の方がより使いやすい仕様になり国内ユーザーの利用率も増加すると思います。
生成AIは今話題となっているテキストや画像以外にも音声や動画など様々な種類の生成AIが誕生しており開発がされおりますので、今後様々な業界で活用されるようになりビジネスや生活する中で活用する機会も増加していくと思います。
生成AIの特徴
生成AIの種類
テキスト生成AI
代表的な生成AI:ChatGPT/Copilot/Gemini/Llama3/Grok-2
画像生成AI
代表的な生成AI:Stable Diffusion/Midjourney/DALL-E3/Adobe Firefly
生成AIのメリット
業務効率化やコスト削減が期待できます
人間が考えて手作業で作成しているものを生成AIが自ら学習してスピーディーに作成できるので、様々な分野の業務効率化やコスト削減が期待できます。
スキルが無くても簡単に完成度が高いものを作成できる
専門的なスキルが必要な業務でも指示を与えるだけで生成AIが作成するので、スキルが無くても簡単に完成度が高いものを作成できます。
革新的で新しいアイデアを創出できる
生成AIは人間のような先入観や固定概念がないので、人間とは発想が異なる革新的で新しいアイデアを創出できます。
生成AIのデメリット
フェイクコンテンツの作成や技術を悪用されるリスクがある
生成AIはまだ完璧な精度ではなく発展途上の段階なので、学習元のデータの真偽を判断できず誤情報やフェイクコンテンツを作成する可能性があります。
また生成AIの技術を悪用して意図的に誤情報を作成されるリスクもあります。
将来的に人間の仕事を奪う業種が出てくる可能性がある
今後様々な生成AIが開発され機能面もアップデートし各業界の企業が導入して応用することで、生成AIの活躍幅が広がり将来的には人間の仕事を奪う業種が出てくる可能性があります。
著作権や商標権など取り扱いには注意が必要
国内では生成AIが自律的に作成した著作物は基本的に著作権は無いですが、人の創作意図や創作的寄与が関わり作成された場合は著作権が認められる場合があります。
また既存の著作物と類似性や依拠性が認められ許可なく利用すれば著作権侵害に該当する可能性があります。
国によって見解が異なりますので取り扱いには注意が必要です。

こちらのサイトでは暗号資産(仮想通貨)に関連することを紹介しています。
今回は暗号資産とは別ジャンルですが生成AIについてご説明します。
生成AIの始まりから現在の状況まで簡潔に説明しておりますので、サクッと内容を理解したい方にオススメです。