AIGC とは: AIGC を 1 つの記事で理解する
AIGCとは何ですか?
AIGCとは英語のAI-generated contentの略で、人工知能が生成したコンテンツのことです。
簡単に言えば、いくつかのプロンプトワードを使用して、テキストコンテンツ、画像、ビデオ、アニメーション、さらにはコードを生成します。
AIGCの原則
AIGCの原理は実はとてもシンプルで、これまでの人工知能の発展により「創発」という能力が現れました。AIGCは人工知能の「創発」能力を利用して、人工知能に想像・推論・分析をさせ、そして最終的にはコンテンツが「出現」します。
AIGCの意味
AIGC はコンテンツ業界全体を変えます。
AIGCにより、テキストコンテンツ、写真コンテンツ、動画コンテンツ、アニメーションコンテンツの生産性が大幅に向上し、コンテンツ制作効率が向上しました。したがって、将来的には、人工知能によって高品質のコンテンツが大量に制作されたり、制作が支援されたりするようになるでしょう。
AIGCの歴史
AIGC、2022年にスタート。
2022 年末の GPT3 と ChatGPT のリリースは、コンテンツ制作の新時代の到来を告げることになります。 AIGCの概念も2023年には普及するだろう。
世界中で、多数の AIGC 起業家チームや個人が起業家ブームの新たなラウンドを開始しています。
Google のデータによると、AIGC 関連の検索ボリュームが急増しています。
AIGC の基礎 - 大規模言語モデル (LLM)
Large Language Model (LLM) はラージ モデルと呼ばれ、AIGC の基礎です。人工知能の新たな能力は、大規模な言語モデルから生まれます。
これまでのところ、大きなモデルは、さまざまな用途に応じて、テキスト、画像、ビデオのカテゴリに分類できます。
1. テキストクラス
ベーシックな大型モデルです。主に対話(チャットボット)、テキスト生成、コード生成などの実装に使用されます。最も有名なものは次のとおりです。
GPT
会話およびテキストのコンテンツ生成用。
OPenAI で作成された大規模モデルは、現在最もよく使用されている大規模モデルです。 ChatGPT は GPT ラージ モデルに基づいています。クローズドソースの大型モデル。
PLM
会話およびテキストのコンテンツ生成用。
Google が作成した大規模モデルは、現時点ではあらゆる面で比較的 GPT に近い大規模モデルです。将来的にオープンソースになるかどうかは不明です。
ラマ
会話およびテキストのコンテンツ生成用。
MATE社製の大型モデル。オープンソースの大規模モデル。
これは、会話とテキスト コンテンツの生成に最適なオープンソースの大規模モデルの 1 つであるはずです。
オンシジウム
会話およびテキストのコンテンツ生成用。
Baidu が作成した大型モデル。現時点で中国語をサポートする最高の大型モデルです。クローズドソース。
2. 絵のカテゴリー
大規模画像モデルは、画像を生成するために使用される大規模なモデルです。テキストから画像への生成 (例: テキストから画像へ)、および画像から画像の生成 (例: 画像から画像へ) を行うことができます。現在、最も人気のある大きな画像モデルは次のとおりです。
旅の途中
画像生成に使用されます。
小規模なチームによって作成されたこのモデルは、現在、画像生成用として最も人気のある大規模モデルです。クローズドソース。
安定した拡散
画像生成に使用されます。
少人数のチームによって構築されました。ミッドジャーニーに近い。オープンソース。
ドール.3
画像生成に使用されます。
OpenAI によって構築されました。クローズドソース。
3.ビデオ大型モデル
ビデオ クラス ラージ モデルは、ビデオを生成するために使用されるラージ モデルです。主に次の 3 つのタイプがあります。
テキストからビデオへの生成: テキストからビデオへ、プロンプトの言葉 (テキスト) を通じてビデオを直接生成します。
画像からビデオへ: 画像からビデオ、写真または写真 + テキストからビデオを生成します。
ビデオからビデオ: ビデオからビデオ、ビデオを通じてビデオを生成、またはビデオ + テキスト。
現在、最も人気のある大規模ビデオ モデルには次のものがあります。
安定した動画の普及
これは、stable.ai によって作成され、最も人気のある大規模ビデオ生成モデルであり、オープンソースです。
第 2 世代
ランウェイによって作られました。現在、最も成熟した大規模ビデオ生成モデルです。クローズドソース。
Gen-2 の大きな特徴は、リアリズムの重視です。したがって、Gen-2 を使用して生成されたビデオは、多くの場合非常にリアルです。
AIGC の鍵 - プロンプト、コンテキスト、AI エージェント
1. プロンプトワード(プロンプト)
大規模なモデルを操作するには、プロンプトを使用します。
チャット、テキストの生成、画像の生成、ビデオの生成。 。 。これらはすべて、プロンプトワードと大規模モデルの間の対話を通じて実装されます。
どのようなコンテンツが生成されるのでしょうか?コンテンツの品質はどうですか?大規模モデルの同じ前提の下で、プロンプトの言葉が異なると、最終結果は大きく異なります。
自然言語を使用したいわゆる人工知能との対話とは、プロンプトワードを指します。
2. コンテキスト
大規模なモデルは、一定の長さのコンテキストに基づいてプロンプトの単語を理解できます。また、各大規模モデルにはコンテキスト長の制限もあり、一般的にコンテキスト長が長いほど、プロンプトワードの理解はプロンプトワードを提案した人の考えに近づきます。
AIGC アプリケーションには、マルチラウンド ダイアログ モードとシングルラウンド ダイアログ モードがあります。
マルチターン ダイアログ モード: 大規模なモデル コンテキストを使用します。
シングルターンダイアログモード: 大規模なモデルコンテキストは使用されません。
実際、多くのコンテンツ生成シナリオではコンテキストは必要なく、シングルラウンドのダイアログ モードだけで十分です。
3.AIエージェント
AI エージェントは、簡単に言えば、大規模なモデルに対して定義された役割です。まず大規模モデルのロールを定義し、次にこのロールに指定したタスクを実行させます。
なぜこんなことをするのかと疑問に思うかもしれません。
実際、それは簡単に理解できます。たとえば、GPT に短編小説を書かせて、同じテーマ、同じタイトルの短編小説を書く場合、登場人物を定義せず、GPT が登場人物をそれぞれ「トルストイ」と「J.K. ローリング」と定義した場合、 3 これらの状況の結果を比較すると、その違いは非常に大きいです。
あなたが試すことができます。
AIGC アプリケーションの方向性
1. 会話型アプリケーション(チャットボット)
現在の対話アプリケーションの主な方向性は、質疑応答、AI ガールフレンド、ロールプレイングなどです。
2. テキストコンテンツ生成(Text Generate)
小説生成、記事生成、論文生成、マーケティングコピー生成など。
テキスト コンテンツの生成は、AIGC の分野で現在最も人気のあるアプリケーションです。
3. 画像コンテンツ生成(AI画像)
4. ビデオ生成(AIビデオ)
5.アニメーション生成(AIアニメ)
6. コード生成(AIコード)
AIGC の業界パターン
1. 大手模型メーカー
AIGC時代の核となるのは大型モデルであり、大型モデルの能力を継続的に向上させることが、大型モデルメーカーの今後の努力の方向性となります。それぞれの大きなモデルはアプリケーション エコシステムを形成します。大手モデルメーカーの利益は、アプリケーションの利益をユーザーに直接提供することによって、または自社のエコシステム内の開発者に料金を請求することによって得られます。
2.AIGCアプリケーションメーカー
一方ではユーザーのニーズを重視し、他方では大型モデルの機能を重視します。 2つの側面から最適な応用ポイント、成長ポイント、収益ポイントを見つけます。
3.AIGCアプリ配信メーカー
多数の AIGC アプリケーションの出現に伴い、AIGC アプリケーションの配布の需要も増加します。より多くの AIGC アプリケーションが Web 上に構築されるため、Web のオープン化により多数のディストリビューション ベンダーが出現しました。これは、モバイル インターネット時代の比較的閉鎖的なアプリケーション ストアというよりは、PC インターネット時代のナビゲーション ステーションに似ています。
AIGC ビジネスを始めるにはどうすればよいですか?
1. AIGC アプリケーションを使用して生産性を向上させたい場合
頻繁に更新される AIGC ナビゲーション ステーションが必要です。または頻繁にフォローしてくださいプロダクトハンター多くの AIGC アプリケーションは、公開後できるだけ早くこの Web サイトに公開され、より多くの注目を集めるためです。
2.AIGCアプリを作りたい場合
まず、各大型モデルの機能をよく理解し、GPT やその他の大型モデルをもっと試してください。
次に、適切なアプリケーション シナリオとアプリケーション ポイントを見つける必要があります。
この 2 つをうまく実行して AIGC アプリケーションを作成するのは非常に簡単です。