تسجيل الدخول

    مراقبة الإنترنت

    Oasis AI: 交互式视频游戏大模型

    最近 Decart AI 推出了一个交互式视频游戏大模型。简单的说,基于这个大模型,你玩的游戏,是根据你的行为 […]

    AI只有Chat?——AIGC产品进化论

    从2022年年底到现在,接近两年的时间,AIGC产品从无到有,从简单的Chatbot套壳和单次generate […]

    AI SAAS的订阅限量:SAAS的新商业模式

    SAAS变了。 一直以来的卖席位,在AI SAAS领域,变成了订阅限量,也就是订阅后每个月renew一定的使用 […]

    Luma: نموذج كبير لتوليد الفيديو لمقاطع الفيديو بجودة الأفلام

    نموذج آخر جديد كبير لتوليد الفيديو - Luma. يدعي أنه قادر على إنشاء مقاطع فيديو بجودة الفيلم. ما هو لوما الذكاء الاصطناعي؟ لوما الذكاء الاصطناعي هو […]

    Kling AI: نموذج إنشاء الفيديو الكبير من Kuaishou يشبه Sora

    Kling AI هو نموذج كبير لتوليد الفيديو تم إصداره بواسطة Kuaishou، ويمكنه إنشاء مقاطع فيديو تصل مدتها إلى دقيقتين. وتتمثل ميزتها الرئيسية في استخدام تقنية التعبير ثلاثي الأبعاد وإعادة بناء الجسم التي طورتها شركة Kuaishou ذاتيًا لدفع التعبيرات وحركات الجسم من خلال صورة لكامل الجسم للشخصية. يعد Kling AI مناسبًا لإنشاء مشاهد مثل مقاطع فيديو لشخصيات تغني وترقص ومقاطع فيديو طويلة.

    ChatTTS: نموذج تحويل النص إلى كلام لسيناريوهات المحادثة

    نظرة عامة في الآونة الأخيرة، أصبح نموذج تحويل النص إلى كلام شائعًا جدًا: ChatTTS. علاوة على ذلك، تم تطوير هذا النموذج من قبل فريق صغير في الصين. قم بالتركيز على[…]

    GPT-4o: نماذج كبيرة مجانية ذات مدخلات ومخرجات مختلطة

    يمثل إصدار GPT-4o علامة فارقة جديدة في النماذج الكبيرة ذات المدخلات والمخرجات الهجينة، مع محادثات أكثر ثراءً وأسرع. إن الاستخدام المجاني ورسوم واجهة برمجة التطبيقات المخفضة تجعل هذه التكنولوجيا في متناول عدد أكبر من الأشخاص. بالمقارنة مع Gemini1.5 Pro، فإن GPT-4o متفوق في تجربة المحادثة، مما يعزز تطوير الروبوتات وتطبيقات AIGC. يمثل هذا التقدم تطورًا مهمًا في مجال الذكاء الاصطناعي التوليدي، مما يوفر إمكانيات جديدة لمجالات مثل التفاعل بين الإنسان والحاسوب وتوليد المحتوى.

    Viggle AI: كيفية إنشاء مقاطع فيديو بحركات شخصية يمكن التحكم فيها

    غالبًا ما تواجه نماذج إنشاء الفيديو مثل Sora وStable Video Dissfusion مشكلة عدم القدرة على التحكم بدقة في إخراج الفيديو، خاصة في حركات الشخصيات. يمكن لنموذج الفيديو الذي يمكن التحكم فيه التحكم بدقة في تصرفات الشخصيات في الفيديو من خلال الكلمات السريعة. يمكن لـ Viggle AI، باعتباره أول نموذج فيديو ثلاثي الأبعاد يتمتع بقدرات فهم جسدية فعلية، التحكم بحرية في حركات الشخصية وهو مضمن في منصة Discord. ستعمل تقنية الفيديو القابلة للتحكم هذه على تقليل تكلفة المنتجات البشرية الرقمية بشكل كبير وتمكين إنشاء فيديو بشري رقمي متنوع.

    اختبار Google Gemini 1.5 Pro الشخصي: قوي وهش في نفس الوقت

    بعد اختبار نموذج الذكاء الاصطناعي متعدد الوسائط Gemini 1.5 Pro الذي تمت ترقيته حديثًا، وجد المستخدمون أنه على الرغم من أنه يدعم نوع إدخال أكثر شمولاً بما في ذلك النصوص والصور ومقاطع الفيديو والملفات والمجلدات، إلا أن القدرة على التفكير لم تتحسن بشكل ملحوظ، خاصة في التمييز الصحيح من الآخر. خطأ. بالإضافة إلى ذلك، تستغرق معالجة مدخلات الفيديو والملفات والمجلدات وقتًا طويلاً، كما توجد قيود في التعامل مع كميات كبيرة من البيانات.

    المواضيع الساخنة في فبراير 2024: Sora - نموذج إنشاء الفيديو الكبير الخاص بـ Open AI

    في 16 فبراير 2024، أصدرت Open AI نموذجها المتقدم لتوليد الفيديو المسمى Sora، مما أثار اهتمامًا ينافس تقريبًا اهتمام GPT. يجمع Sora، الذي لم يكن متاحًا للاستخدام العام بعد، بين بنيات المحولات والانتشار لمحاكاة الفيديو عالية الدقة. يعرض TikTok قدرات Sora من خلال مقاطع فيديو غير محررة من مطالبات مختلفة، مع معاينة تأثيرها المحتمل في مجال إنشاء الفيديو المزدهر.



    حقوق الطبع والنشر © www.lyustu.com جميع الحقوق محفوظة.
    الموضوع: TheMoon V3.0 الكاتب:نيو يانغ