نظرة عامة في الآونة الأخيرة، أصبح نموذج تحويل النص إلى كلام شائعًا جدًا: ChatTTS. علاوة على ذلك، تم تطوير هذا النموذج من قبل فريق صغير في الصين. قم بالتركيز على[…]
يمثل إصدار GPT-4o علامة فارقة جديدة في النماذج الكبيرة ذات المدخلات والمخرجات الهجينة، مع محادثات أكثر ثراءً وأسرع. إن الاستخدام المجاني ورسوم واجهة برمجة التطبيقات المخفضة تجعل هذه التكنولوجيا في متناول عدد أكبر من الأشخاص. بالمقارنة مع Gemini1.5 Pro، فإن GPT-4o متفوق في تجربة المحادثة، مما يعزز تطوير الروبوتات وتطبيقات AIGC. يمثل هذا التقدم تطورًا مهمًا في مجال الذكاء الاصطناعي التوليدي، مما يوفر إمكانيات جديدة لمجالات مثل التفاعل بين الإنسان والحاسوب وتوليد المحتوى.
غالبًا ما تواجه نماذج إنشاء الفيديو مثل Sora وStable Video Dissfusion مشكلة عدم القدرة على التحكم بدقة في إخراج الفيديو، خاصة في حركات الشخصيات. يمكن لنموذج الفيديو الذي يمكن التحكم فيه التحكم بدقة في تصرفات الشخصيات في الفيديو من خلال الكلمات السريعة. يمكن لـ Viggle AI، باعتباره أول نموذج فيديو ثلاثي الأبعاد يتمتع بقدرات فهم جسدية فعلية، التحكم بحرية في حركات الشخصية وهو مضمن في منصة Discord. ستعمل تقنية الفيديو القابلة للتحكم هذه على تقليل تكلفة المنتجات البشرية الرقمية بشكل كبير وتمكين إنشاء فيديو بشري رقمي متنوع.
بعد اختبار نموذج الذكاء الاصطناعي متعدد الوسائط Gemini 1.5 Pro الذي تمت ترقيته حديثًا، وجد المستخدمون أنه على الرغم من أنه يدعم نوع إدخال أكثر شمولاً بما في ذلك النصوص والصور ومقاطع الفيديو والملفات والمجلدات، إلا أن القدرة على التفكير لم تتحسن بشكل ملحوظ، خاصة في التمييز الصحيح من الآخر. خطأ. بالإضافة إلى ذلك، تستغرق معالجة مدخلات الفيديو والملفات والمجلدات وقتًا طويلاً، كما توجد قيود في التعامل مع كميات كبيرة من البيانات.
في 16 فبراير 2024، أصدرت Open AI نموذجها المتقدم لتوليد الفيديو المسمى Sora، مما أثار اهتمامًا ينافس تقريبًا اهتمام GPT. يجمع Sora، الذي لم يكن متاحًا للاستخدام العام بعد، بين بنيات المحولات والانتشار لمحاكاة الفيديو عالية الدقة. يعرض TikTok قدرات Sora من خلال مقاطع فيديو غير محررة من مطالبات مختلفة، مع معاينة تأثيرها المحتمل في مجال إنشاء الفيديو المزدهر.
نظرة عامة على Google Gemini1.5 pro Google Gemini1.5 pro في 15 فبراير 2024 […]
1. مؤشرات Google: قارن "AI"، "gpt"، "palworld" هذه لقطة شاشة من اليوم (2024/01/31). […]
في 6 نوفمبر 2023، تم إصدار الإصدار 6.4.2 من WordPress. وبعد يومين، قمت بنقل مدونتي إلى خادم آخر. لاحقاً […]
اليوم، شارك أحد الأصدقاء مقالًا، مؤخرًا، عادت Jasper، أول شركة يونيكورن تقوم بتنفيذ AIGC، إلى الصفر. جاسبر، استنادا إلى GPT، هو […]
الذكاء الاصطناعي فرصة كبيرة. لذلك، الجميع يستكشفون، سواء كانوا يعرفون ماذا يفعلون أو ما لا يعرفون ماذا يفعلون. في الوقت الحاضر، اتجاه الاستكشاف هو بشكل رئيسي في [...]