Google Gemini 1.5 Pro親測：強大與脆弱並存

作者：neo yang 時間：2024/03/17 讀： 7042

使用者在測試新升級的多模態AI模型Gemini 1.5 Pro後發現，儘管它支援更全面的輸入類型包括文字、圖片、影片、檔案和資料夾，推理能力卻沒有顯著提升，特別在分辨是非方面。此外，處理影片、文件和資料夾輸入時耗時較長，且對大量資料的處理有限制。

概述

前段時間，申請了一下Gemini 1.5 Pro的wishlist。之後，就忘到一邊去了。今天登入了一下Google AI Studio，發現，我已經可以用Gemini 1.5 pro了。於是，測試了一下。後邊準備把現在正在使用的Gemini 1.0 pro切換到Gemini 1.5 pro。

Gemini 1.5 pro 可以支援文字、圖片、影片、檔案、資料夾作為prompt輸入。

倒是沒什麼太特別的。

輸入圖片，Gemini1.5 pro回傳結果的時間直接超過30秒。

我特意說它是錯的，它竟然承認。看來Gemini分辨是非的能力比較差。

輸入視頻，Gemini1.5 pro的返回結果的時間超過200秒。

輸入文件，Gemini1.5 pro回傳結果的時間也超過200秒。

輸入資料夾，內容太多，再加上之前的內容，導致prompt的token超過限額，無法回傳結果。

作為一個多模態的大模型，Gemini 1.5 pro比起1.0來，最明顯的特徵就是可以輸入的類型比較全面了。文字、圖片、影片、文件和資料夾。

但，似乎推理能力，並沒有明顯的進步。至少還是做不到分辨是非。