Persönlicher Test von Google Gemini 1.5 Pro: leistungsstark und zerbrechlich zugleich

Autor:Neo-Yang Zeit:2024/03/17 Lesen: 8408

Nach dem Test des neu aktualisierten multimodalen KI-Modells Gemini 1.5 Pro stellten Benutzer fest, dass es zwar einen umfassenderen Eingabetyp unterstützt, einschließlich Text, Bilder, Videos, Dateien und Ordner, die Argumentationsfähigkeit jedoch nicht wesentlich verbessert wurde, insbesondere bei der Unterscheidung von rechts und links falsch. Darüber hinaus nimmt die Verarbeitung von Video-, Datei- und Ordnereingaben viel Zeit in Anspruch und es bestehen Einschränkungen bei der Verarbeitung großer Datenmengen.

Überblick

前段时间，申请了一下Gemini 1.5 Pro的wishlist。之后，就忘到一边去了。今天登录了一下Google AI Studio，发现，我已经可以用Gemini 1.5 pro了。于是，测试了一下。后边准备把现在正在用的Gemini 1.0 pro切换到Gemini 1.5 pro。

Gemini 1.5 pro 可以支持文字、图片、视频、文件、文件夹作为prompt输入。

输入文字

倒是没什么太特别的。

输入图片+文字

输入图片，Gemini1.5 pro返回结果的时间直接超过30秒。

我特意说它是错的，它竟然承认。看来Gemini分辨是非的能力比较差。

输入视频+文字

输入视频，Gemini1.5 pro的返回结果的时间超过200秒。

输入文件+文字

输入文件，Gemini1.5 pro返回结果的时间也超过200秒。

输入文件夹+文字

输入文件夹，内容太多，再加上之前的内容，导致prompt的token超过限额，无法返回结果。

Zusammenfassen

作为一个多模态的大模型，Gemini 1.5 pro比起1.0来，最明显的特点就是可以输入的类型比较全面了。文字、图片、视频、文件和文件夹。

但，似乎推理能力，并没有明显的进步。至少还是做不到分辨是非。

Stichworte:AIGC , KI

关注我的微信公众号