Персональный тест Google Gemini 1.5 Pro: мощный и хрупкий одновременно
Обзор
Некоторое время назад я подал заявку на участие в списке желаний Gemini 1.5 Pro. После этого это забылось. Сегодня я вошел в Google AI Studio и обнаружил, что уже могу использовать Gemini 1.5 pro. Итак, я протестировал это. Позже планирую перейти с Gemini 1.0 pro на Gemini 1.5 pro.
Gemini 1.5 pro может поддерживать ввод текста, изображений, видео, файлов и папок в качестве подсказок.
Введите текст
В этом нет ничего особенного.
Введите картинку + текст
Когда вы вводите изображение, Gemini1.5 pro возвращает результаты более 30 секунд.
Я специально сказал, что это неправильно, и оно это признало. Кажется, что способность Близнецов отличать добро от зла относительно слаба.
Введите видео + текст
При вводе видео Gemini1.5 pro требуется более 200 секунд, чтобы вернуть результаты.
Входной файл + текст
При вводе файлов Gemini1.5 pro также требуется более 200 секунд для возврата результатов.
Введите папку + текст
Во входной папке слишком много содержимого, и вместе с предыдущим содержимым токен приглашения превышает лимит, и результат не может быть возвращен.
Подведем итог
Поскольку Gemini 1.5 pro является большой мультимодальной моделью, наиболее очевидной особенностью Gemini 1.5 pro по сравнению с версией 1.0 является то, что типы ввода являются более полными. Текст, картинки, видео, файлы и папки.
Тем не менее, похоже, что явного улучшения способности к рассуждению не наблюдается. По крайней мере, я до сих пор не могу отличить правильное от неправильного.