最近 Decart AI 推出了一个交互式视频游戏大模型。简单的说,基于这个大模型,你玩的游戏,是根据你的行为 […]
从2022年年底到现在,接近两年的时间,AIGC产品从无到有,从简单的Chatbot套壳和单次generate […]
SAAS变了。 一直以来的卖席位,在AI SAAS领域,变成了订阅限量,也就是订阅后每个月renew一定的使用 […]
نموذج آخر جديد كبير لتوليد الفيديو - Luma. يدعي أنه قادر على إنشاء مقاطع فيديو بجودة الفيلم. ما هو لوما الذكاء الاصطناعي؟ لوما الذكاء الاصطناعي هو […]
Kling AI هو نموذج كبير لتوليد الفيديو تم إصداره بواسطة Kuaishou، ويمكنه إنشاء مقاطع فيديو تصل مدتها إلى دقيقتين. وتتمثل ميزتها الرئيسية في استخدام تقنية التعبير ثلاثي الأبعاد وإعادة بناء الجسم التي طورتها شركة Kuaishou ذاتيًا لدفع التعبيرات وحركات الجسم من خلال صورة لكامل الجسم للشخصية. يعد Kling AI مناسبًا لإنشاء مشاهد مثل مقاطع فيديو لشخصيات تغني وترقص ومقاطع فيديو طويلة.
نظرة عامة في الآونة الأخيرة، أصبح نموذج تحويل النص إلى كلام شائعًا جدًا: ChatTTS. علاوة على ذلك، تم تطوير هذا النموذج من قبل فريق صغير في الصين. قم بالتركيز على[…]
يمثل إصدار GPT-4o علامة فارقة جديدة في النماذج الكبيرة ذات المدخلات والمخرجات الهجينة، مع محادثات أكثر ثراءً وأسرع. إن الاستخدام المجاني ورسوم واجهة برمجة التطبيقات المخفضة تجعل هذه التكنولوجيا في متناول عدد أكبر من الأشخاص. بالمقارنة مع Gemini1.5 Pro، فإن GPT-4o متفوق في تجربة المحادثة، مما يعزز تطوير الروبوتات وتطبيقات AIGC. يمثل هذا التقدم تطورًا مهمًا في مجال الذكاء الاصطناعي التوليدي، مما يوفر إمكانيات جديدة لمجالات مثل التفاعل بين الإنسان والحاسوب وتوليد المحتوى.
غالبًا ما تواجه نماذج إنشاء الفيديو مثل Sora وStable Video Dissfusion مشكلة عدم القدرة على التحكم بدقة في إخراج الفيديو، خاصة في حركات الشخصيات. يمكن لنموذج الفيديو الذي يمكن التحكم فيه التحكم بدقة في تصرفات الشخصيات في الفيديو من خلال الكلمات السريعة. يمكن لـ Viggle AI، باعتباره أول نموذج فيديو ثلاثي الأبعاد يتمتع بقدرات فهم جسدية فعلية، التحكم بحرية في حركات الشخصية وهو مضمن في منصة Discord. ستعمل تقنية الفيديو القابلة للتحكم هذه على تقليل تكلفة المنتجات البشرية الرقمية بشكل كبير وتمكين إنشاء فيديو بشري رقمي متنوع.
بعد اختبار نموذج الذكاء الاصطناعي متعدد الوسائط Gemini 1.5 Pro الذي تمت ترقيته حديثًا، وجد المستخدمون أنه على الرغم من أنه يدعم نوع إدخال أكثر شمولاً بما في ذلك النصوص والصور ومقاطع الفيديو والملفات والمجلدات، إلا أن القدرة على التفكير لم تتحسن بشكل ملحوظ، خاصة في التمييز الصحيح من الآخر. خطأ. بالإضافة إلى ذلك، تستغرق معالجة مدخلات الفيديو والملفات والمجلدات وقتًا طويلاً، كما توجد قيود في التعامل مع كميات كبيرة من البيانات.
في 16 فبراير 2024، أصدرت Open AI نموذجها المتقدم لتوليد الفيديو المسمى Sora، مما أثار اهتمامًا ينافس تقريبًا اهتمام GPT. يجمع Sora، الذي لم يكن متاحًا للاستخدام العام بعد، بين بنيات المحولات والانتشار لمحاكاة الفيديو عالية الدقة. يعرض TikTok قدرات Sora من خلال مقاطع فيديو غير محررة من مطالبات مختلفة، مع معاينة تأثيرها المحتمل في مجال إنشاء الفيديو المزدهر.