Авторизоваться

Персональный тест Google Gemini 1.5 Pro: мощный и хрупкий одновременно

Автор:нео Ян Время:2024/03/17 Читать: 6416
После тестирования недавно обновленной мультимодальной модели искусственного интеллекта Gemini 1.5 Pro пользователи обнаружили, что, хотя она поддерживает более полный тип ввода, включая текст, изображения, видео, файлы и папки, способность к рассуждению существенно не улучшилась, особенно при различении правильного и неправильный. Кроме того, обработка входных данных видео, файлов и папок занимает много времени, а обработка больших объемов данных имеет ограничения.

Обзор

Некоторое время назад я подал заявку на участие в списке желаний Gemini 1.5 Pro. После этого это забылось. Сегодня я вошел в Google AI Studio и обнаружил, что уже могу использовать Gemini 1.5 pro. Итак, я протестировал это. Позже планирую перейти с Gemini 1.0 pro на Gemini 1.5 pro.

Gemini 1.5 pro может поддерживать ввод текста, изображений, видео, файлов и папок в качестве подсказок.

Введите текст

В этом нет ничего особенного.

Введите картинку + текст

Когда вы вводите изображение, Gemini1.5 pro возвращает результаты более 30 секунд.

Я специально сказал, что это неправильно, и оно это признало. Кажется, что способность Близнецов отличать добро от зла относительно слаба.

Введите видео + текст

При вводе видео Gemini1.5 pro требуется более 200 секунд, чтобы вернуть результаты.

Входной файл + текст

При вводе файлов Gemini1.5 pro также требуется более 200 секунд для возврата результатов.

Введите папку + текст

Во входной папке слишком много содержимого, и вместе с предыдущим содержимым токен приглашения превышает лимит, и результат не может быть возвращен.

Подведем итог

Поскольку Gemini 1.5 pro является большой мультимодальной моделью, наиболее очевидной особенностью Gemini 1.5 pro по сравнению с версией 1.0 является то, что типы ввода являются более полными. Текст, картинки, видео, файлы и папки.

Тем не менее, похоже, что явного улучшения способности к рассуждению не наблюдается. По крайней мере, я до сих пор не могу отличить правильное от неправильного.

теги: ,


авторские права © www.lyustu.com, все права защищены.
Тема: TheMoon V3.0 Автор: neo yang