最近 Decart AI 推出了一个交互式视频游戏大模型。简单的说,基于这个大模型,你玩的游戏,是根据你的行为实时生成的,你做了什么,Oasis AI就实时生成相应的游戏场景。 一、Oasis AI是什么? Oasis是 […]
从2022年年底到现在,接近两年的时间,AIGC产品从无到有,从简单的Chatbot套壳和单次generate,发展到现在,不仅应用到了各种应用场景和领域,而且产品形态也有了很多的发展。 本文从用户需求的发展来聊聊AIG […]
SAAS变了。 一直以来的卖席位,在AI SAAS领域,变成了订阅限量,也就是订阅后每个月renew一定的使用额度,本质上,还是按交付结果付费。 一、SaaS的新付费模式 用户订阅,每个月获得一定的额度,每次获取新的结果 […]
もう 1 つの新しい大規模ビデオ生成モデル、Luma。映画品質のビデオを生成できると主張しています。 Luma AIとは何ですか? Luma AI は、120 秒のビデオを生成できる大規模なビデオ生成モデルです。ビデオはテキストから、または写真とテキストから生成できます。ルマA […]
Kling AI は、Kuaishou がリリースした大規模なビデオ生成モデルで、最大 2 分のビデオを生成できます。その主な利点は、Kuaishou が独自に開発した 3D 表現および身体再構成技術を使用して、キャラクターの全身写真を通じて表情と身体の動きを駆動することです。 Kling AIは、キャラクターが歌ったり踊ったりする動画や長時間の動画などのシーンの生成に適しています。
概要 最近、テキスト読み上げモデルである ChatTTS が非常に人気になっています。さらに、このモデルは中国の小さなチームによって開発されました。会話シナリオに重点を置いたテキスト読み上げ。 ChatTTSとは何ですか? ChatTTS は、会話シナリオ用のテキスト読み上げモデルです。チャットTTS […]
GPT-4o のリリースは、より豊かで高速な会話を可能にする、ハイブリッド入出力大型モデルの新たなマイルストーンをマークします。無料使用と API 料金の削減により、より多くの人がこのテクノロジーにアクセスできるようになります。 GPT-4oはGemini1.5 Proと比べて会話体験に優れており、ロボットやAIGCアプリケーションの開発を促進します。この進歩は生成 AI の分野における重要な発展を表しており、人間とコンピューターの対話やコンテンツ生成などの分野に新たな可能性をもたらします。
Sora や Stable Video Disfusion などのビデオ生成モデルは、出力ビデオ、特にキャラクターの動きを正確に制御できないという問題に直面することがよくあります。制御可能なビデオ モデルは、プロンプト ワードを通じてビデオ内のキャラクターの動作を正確に制御できます。 Viggle AI は、実際の物理的理解機能を備えた初のビデオ 3D モデルとして、キャラクターの動きを自由に制御でき、Discord プラットフォームに組み込まれています。この制御可能なビデオ技術により、デジタル ヒューマン製品のコストが大幅に削減され、多様なデジタル ヒューマン ビデオの作成が可能になります。
新しくアップグレードされたマルチモーダル AI モデル Gemini 1.5 Pro をテストした後、ユーザーは、テキスト、画像、ビデオ、ファイル、フォルダーを含むより包括的な入力タイプをサポートしているにもかかわらず、特に右と右を区別する推論能力が大幅に向上していないことに気づきました。間違っている。さらに、ビデオ、ファイル、フォルダーの入力の処理には時間がかかり、大量のデータの処理には制限があります。
2024 年 2 月 16 日、Open AI は、Sora という名前の高度なビデオ生成モデルをリリースし、GPT に匹敵するほどの関心を呼び起こしました。Sora はまだ一般には利用できませんが、Transformer と拡散アーキテクチャを組み合わせて高忠実度のビデオ シミュレーションを実現します。 TikTok は、さまざまなプロンプトからの未編集のビデオで Sora の機能を紹介し、急成長するビデオ生成分野における潜在的な影響をプレビューします。