اختبار Google Gemini 1.5 Pro الشخصي: قوي وهش في نفس الوقت

مؤلف:نيو يانغ وقت:2024/03/17 يقرأ: 8378

بعد اختبار نموذج الذكاء الاصطناعي متعدد الوسائط Gemini 1.5 Pro الذي تمت ترقيته حديثًا، وجد المستخدمون أنه على الرغم من أنه يدعم نوع إدخال أكثر شمولاً بما في ذلك النصوص والصور ومقاطع الفيديو والملفات والمجلدات، إلا أن القدرة على التفكير لم تتحسن بشكل ملحوظ، خاصة في التمييز الصحيح من الآخر. خطأ. بالإضافة إلى ذلك، تستغرق معالجة مدخلات الفيديو والملفات والمجلدات وقتًا طويلاً، كما توجد قيود في التعامل مع كميات كبيرة من البيانات.

ملخص

منذ بعض الوقت، تقدمت بطلب للحصول على قائمة أمنيات Gemini 1.5 Pro. بعد ذلك، تم نسيانه. لقد قمت بتسجيل الدخول إلى Google AI Studio اليوم ووجدت أنه يمكنني بالفعل استخدام Gemini 1.5 pro. لذا، قمت باختباره. وأخطط لاحقًا للتبديل من Gemini 1.0 pro إلى Gemini 1.5 pro.

يمكن لـ Gemini 1.5 pro دعم النصوص والصور ومقاطع الفيديو والملفات والمجلدات كإدخال سريع.

أدخل النص

لا يوجد شيء مميز للغاية.

أدخل الصورة + النص

عند إدخال صورة، يستغرق برنامج Gemini1.5 pro أكثر من 30 ثانية لإرجاع النتائج.

لقد قلت على وجه التحديد أنه كان خطأ واعترفت بذلك. يبدو أن قدرة مولود الجوزاء على التمييز بين الصواب والخطأ ضعيفة نسبياً.

أدخل الفيديو + النص

عند إدخال مقطع فيديو، يستغرق Gemini1.5 pro أكثر من 200 ثانية لإرجاع النتائج.

ملف الإدخال + النص

عند إدخال الملفات، يستغرق Gemini1.5 pro أيضًا أكثر من 200 ثانية لإرجاع النتائج.

أدخل المجلد + النص

يوجد محتوى كبير جدًا في مجلد الإدخال، ومع المحتوى السابق، يتجاوز رمز المطالبة الحد الأقصى ولا يمكن إرجاع النتيجة.

لخص

باعتباره نموذجًا كبيرًا متعدد الوسائط، فإن الميزة الأكثر وضوحًا في Gemini 1.5 pro مقارنة بالإصدار 1.0 هي أن أنواع الإدخال أكثر شمولاً. النصوص والصور ومقاطع الفيديو والملفات والمجلدات.

ومع ذلك، يبدو أنه لا يوجد تحسن واضح في القدرة على التفكير. على الأقل ما زلت لا أستطيع التمييز بين الصواب والخطأ.

العلامات:AIGC , منظمة العفو الدولية

关注我的微信公众号