Osobisty test Google Gemini 1.5 Pro: mocny i delikatny jednocześnie

Autor:neo-yang Czas:2024/03/17 Czytać: 6327

Po przetestowaniu nowo ulepszonego, multimodalnego modelu AI Gemini 1.5 Pro użytkownicy odkryli, że chociaż obsługuje on bardziej wszechstronne typy danych wejściowych, w tym tekst, obrazy, filmy, pliki i foldery, zdolność rozumowania nie uległa znaczącej poprawie, szczególnie w zakresie odróżniania od zło. Ponadto przetwarzanie danych wejściowych wideo, plików i folderów zajmuje dużo czasu, a obsługa dużych ilości danych wiąże się z ograniczeniami.

Przegląd

前段时间，申请了一下Gemini 1.5 Pro的wishlist。之后，就忘到一边去了。今天登录了一下Google AI Studio，发现，我已经可以用Gemini 1.5 pro了。于是，测试了一下。后边准备把现在正在用的Gemini 1.0 pro切换到Gemini 1.5 pro。

Gemini 1.5 pro 可以支持文字、图片、视频、文件、文件夹作为prompt输入。

输入文字

倒是没什么太特别的。

输入图片+文字

输入图片，Gemini1.5 pro返回结果的时间直接超过30秒。

我特意说它是错的，它竟然承认。看来Gemini分辨是非的能力比较差。

输入视频+文字

输入视频，Gemini1.5 pro的返回结果的时间超过200秒。

输入文件+文字

输入文件，Gemini1.5 pro返回结果的时间也超过200秒。

输入文件夹+文字

输入文件夹，内容太多，再加上之前的内容，导致prompt的token超过限额，无法返回结果。

Podsumować

作为一个多模态的大模型，Gemini 1.5 pro比起1.0来，最明显的特点就是可以输入的类型比较全面了。文字、图片、视频、文件和文件夹。

但，似乎推理能力，并没有明显的进步。至少还是做不到分辨是非。

tagi:AIGC , sztuczna inteligencja