概要 最近、テキスト読み上げモデルである ChatTTS が非常に人気になっています。さらに、このモデルは中国の小さなチームによって開発されました。会話シナリオに重点を置いたテキスト読み上げ。 ChatTTSとは何ですか? ChatTTS は、会話シナリオ用のテキスト読み上げモデルです。チャットTTS […]
GPT-4o のリリースは、より豊かで高速な会話を可能にする、ハイブリッド入出力大型モデルの新たなマイルストーンをマークします。無料使用と API 料金の削減により、より多くの人がこのテクノロジーにアクセスできるようになります。 GPT-4oはGemini1.5 Proと比べて会話体験に優れており、ロボットやAIGCアプリケーションの開発を促進します。この進歩は生成 AI の分野における重要な発展を表しており、人間とコンピューターの対話やコンテンツ生成などの分野に新たな可能性をもたらします。
Sora や Stable Video Disfusion などのビデオ生成モデルは、出力ビデオ、特にキャラクターの動きを正確に制御できないという問題に直面することがよくあります。制御可能なビデオ モデルは、プロンプト ワードを通じてビデオ内のキャラクターの動作を正確に制御できます。 Viggle AI は、実際の物理的理解機能を備えた初のビデオ 3D モデルとして、キャラクターの動きを自由に制御でき、Discord プラットフォームに組み込まれています。この制御可能なビデオ技術により、デジタル ヒューマン製品のコストが大幅に削減され、多様なデジタル ヒューマン ビデオの作成が可能になります。
新しくアップグレードされたマルチモーダル AI モデル Gemini 1.5 Pro をテストした後、ユーザーは、テキスト、画像、ビデオ、ファイル、フォルダーを含むより包括的な入力タイプをサポートしているにもかかわらず、特に右と右を区別する推論能力が大幅に向上していないことに気づきました。間違っている。さらに、ビデオ、ファイル、フォルダーの入力の処理には時間がかかり、大量のデータの処理には制限があります。
2024 年 2 月 16 日、Open AI は、Sora という名前の高度なビデオ生成モデルをリリースし、GPT に匹敵するほどの関心を呼び起こしました。Sora はまだ一般には利用できませんが、Transformer と拡散アーキテクチャを組み合わせて高忠実度のビデオ シミュレーションを実現します。 TikTok は、さまざまなプロンプトからの未編集のビデオで Sora の機能を紹介し、急成長するビデオ生成分野における潜在的な影響をプレビューします。
Google Gemini1.5 pro の概要 Google Gemini1.5 pro は 2024 年 2 月 15 日にリリースされます。以下の図に示すように、100 万トークンのコンテキスト長がサポートされています。 簡単に言うと、Gemini 1.5 pro はそれを 1 回で処理できます […]
1. Google トレンド:「AI」、「gpt」、「palworld」を比較 これは今日(2024/01/31)のスクリーンショットです。 1 月の最大のホットスポットの 1 つはパルワールドです。このゲームは1月19日にローンチされ、4日間で1億ドルを稼いだと言われています。 G […]
2023 年 11 月 6 日に、WordPress v6.4.2 がリリースされました。 2日後、私はブログを別のサーバーに移行しました。次に、ついでにWordPressをアップグレードします。アップグレード後、自分でデザイン、開発した WordPress テーマ、Themoon が […]
今日、友人が記事をシェアしてくれましたが、最近、AIGCを行った最初のユニコーン企業であるJasperがゼロに戻りました。 Jasper は GPT をベースとしており、新たなシェルを必要としない ChatGPT と同等であり、主にセルフメディア コンテンツや企業マーケティング コンテンツの生成に使用されます。 2021年に登場し、年収数千万ドルを稼ぐ […]
AI は大きなチャンスです。したがって、何をすればよいのか、何をすればよいのかわからないのか、誰もが模索しています。現時点での探査方向は主に以下の2方向である。 1. AIGC コンテンツ産業は非常に収益性の高い産業です。さらに、コンテンツ産業は観光から食品まで、ほぼすべての産業をカバーしています。