Google Gemini 1.5 Pro persoonlijke test: krachtig en kwetsbaar tegelijk
Na het testen van het onlangs geüpgradede multimodale AI-model Gemini 1.5 Pro ontdekten gebruikers dat, hoewel het een uitgebreider invoertype ondersteunt, inclusief tekst, afbeeldingen, video's, bestanden en mappen, het redeneervermogen niet significant is verbeterd, vooral niet bij het onderscheiden van recht van fout. Bovendien duurt de verwerking van invoer van video's, bestanden en mappen lang en zijn er beperkingen bij het verwerken van grote hoeveelheden gegevens.
概述
前段时间,申请了一下Gemini 1.5 Pro的wishlist。之后,就忘到一边去了。今天登录了一下Google AI Studio,发现,我已经可以用Gemini 1.5 pro了。于是,测试了一下。后边准备把现在正在用的Gemini 1.0 pro切换到Gemini 1.5 pro。
Gemini 1.5 pro 可以支持文字、图片、视频、文件、文件夹作为prompt输入。
输入文字
倒是没什么太特别的。
输入图片+文字
输入图片,Gemini1.5 pro返回结果的时间直接超过30秒。
我特意说它是错的,它竟然承认。看来Gemini分辨是非的能力比较差。
输入视频+文字
输入视频,Gemini1.5 pro的返回结果的时间超过200秒。
输入文件+文字
输入文件,Gemini1.5 pro返回结果的时间也超过200秒。
输入文件夹+文字
输入文件夹,内容太多,再加上之前的内容,导致prompt的token超过限额,无法返回结果。
总结
作为一个多模态的大模型,Gemini 1.5 pro比起1.0来,最明显的特点就是可以输入的类型比较全面了。文字、图片、视频、文件和文件夹。
但,似乎推理能力,并没有明显的进步。至少还是做不到分辨是非。