تسجيل الدخول

    مراقبة الإنترنت

    ChatTTS: نموذج تحويل النص إلى كلام لسيناريوهات المحادثة

    نظرة عامة في الآونة الأخيرة، أصبح نموذج تحويل النص إلى كلام شائعًا جدًا: ChatTTS. علاوة على ذلك، تم تطوير هذا النموذج من قبل فريق صغير في الصين. قم بالتركيز على[…]

    GPT-4o: نماذج كبيرة مجانية ذات مدخلات ومخرجات مختلطة

    يمثل إصدار GPT-4o علامة فارقة جديدة في النماذج الكبيرة ذات المدخلات والمخرجات الهجينة، مع محادثات أكثر ثراءً وأسرع. إن الاستخدام المجاني ورسوم واجهة برمجة التطبيقات المخفضة تجعل هذه التكنولوجيا في متناول عدد أكبر من الأشخاص. بالمقارنة مع Gemini1.5 Pro، فإن GPT-4o متفوق في تجربة المحادثة، مما يعزز تطوير الروبوتات وتطبيقات AIGC. يمثل هذا التقدم تطورًا مهمًا في مجال الذكاء الاصطناعي التوليدي، مما يوفر إمكانيات جديدة لمجالات مثل التفاعل بين الإنسان والحاسوب وتوليد المحتوى.

    Viggle AI: كيفية إنشاء مقاطع فيديو بحركات شخصية يمكن التحكم فيها

    غالبًا ما تواجه نماذج إنشاء الفيديو مثل Sora وStable Video Dissfusion مشكلة عدم القدرة على التحكم بدقة في إخراج الفيديو، خاصة في حركات الشخصيات. يمكن لنموذج الفيديو الذي يمكن التحكم فيه التحكم بدقة في تصرفات الشخصيات في الفيديو من خلال الكلمات السريعة. يمكن لـ Viggle AI، باعتباره أول نموذج فيديو ثلاثي الأبعاد يتمتع بقدرات فهم جسدية فعلية، التحكم بحرية في حركات الشخصية وهو مضمن في منصة Discord. ستعمل تقنية الفيديو القابلة للتحكم هذه على تقليل تكلفة المنتجات البشرية الرقمية بشكل كبير وتمكين إنشاء فيديو بشري رقمي متنوع.

    اختبار Google Gemini 1.5 Pro الشخصي: قوي وهش في نفس الوقت

    بعد اختبار نموذج الذكاء الاصطناعي متعدد الوسائط Gemini 1.5 Pro الذي تمت ترقيته حديثًا، وجد المستخدمون أنه على الرغم من أنه يدعم نوع إدخال أكثر شمولاً بما في ذلك النصوص والصور ومقاطع الفيديو والملفات والمجلدات، إلا أن القدرة على التفكير لم تتحسن بشكل ملحوظ، خاصة في التمييز الصحيح من الآخر. خطأ. بالإضافة إلى ذلك، تستغرق معالجة مدخلات الفيديو والملفات والمجلدات وقتًا طويلاً، كما توجد قيود في التعامل مع كميات كبيرة من البيانات.

    المواضيع الساخنة في فبراير 2024: Sora - نموذج إنشاء الفيديو الكبير الخاص بـ Open AI

    في 16 فبراير 2024، أصدرت Open AI نموذجها المتقدم لتوليد الفيديو المسمى Sora، مما أثار اهتمامًا ينافس تقريبًا اهتمام GPT. يجمع Sora، الذي لم يكن متاحًا للاستخدام العام بعد، بين بنيات المحولات والانتشار لمحاكاة الفيديو عالية الدقة. يعرض TikTok قدرات Sora من خلال مقاطع فيديو غير محررة من مطالبات مختلفة، مع معاينة تأثيرها المحتمل في مجال إنشاء الفيديو المزدهر.

    الجوزاء 1.5 برو: كيفية التقديم

    نظرة عامة على Google Gemini1.5 pro Google Gemini1.5 pro في 15 فبراير 2024 […]

    مواضيع ساخنة في يناير 2024: palworld

    1. مؤشرات Google: قارن "AI"، "gpt"، "palworld" هذه لقطة شاشة من اليوم (2024/01/31). […]

    تجربة WordPress الجديدة: إنشاء مواقع ويب باستخدام SAAS، ذات التعليمات البرمجية المنخفضة وبدون تعليمات برمجية

    في 6 نوفمبر 2023، تم إصدار الإصدار 6.4.2 من WordPress. وبعد يومين، قمت بنقل مدونتي إلى خادم آخر. لاحقاً […]

    لقد تم حل الموجة الأولى من فرق ريادة الأعمال في AIGC، فهل لا يزال هناك مستقبل لـ AIGC؟

    اليوم، شارك أحد الأصدقاء مقالًا، مؤخرًا، عادت Jasper، أول شركة يونيكورن تقوم بتنفيذ AIGC، إلى الصفر. جاسبر، استنادا إلى GPT، هو […]

    اتجاه الذكاء الاصطناعي التوليدي – طفرة في الروبوتات

      الذكاء الاصطناعي فرصة كبيرة. لذلك، الجميع يستكشفون، سواء كانوا يعرفون ماذا يفعلون أو ما لا يعرفون ماذا يفعلون. في الوقت الحاضر، اتجاه الاستكشاف هو بشكل رئيسي في [...]



    حقوق الطبع والنشر © www.lyustu.com جميع الحقوق محفوظة.
    الموضوع: TheMoon V3.0 الكاتب:نيو يانغ