登入

Google Gemini 1.5 Pro親測:強大與脆弱並存

作者:neo yang 時間:2024/03/17 讀: 6413
使用者在測試新升級的多模態AI模型Gemini 1.5 Pro後發現,儘管它支援更全面的輸入類型包括文字、圖片、影片、檔案和資料夾,推理能力卻沒有顯著提升,特別在分辨是非方面。此外,處理影片、文件和資料夾輸入時耗時較長,且對大量資料的處理有限制。

概述

前段時間,申請了一下Gemini 1.5 Pro的wishlist。之後,就忘到一邊去了。今天登入了一下Google AI Studio,發現,我已經可以用Gemini 1.5 pro了。於是,測試了一下。後邊準備把現在正在使用的Gemini 1.0 pro切換到Gemini 1.5 pro。

Gemini 1.5 pro 可以支援文字、圖片、影片、檔案、資料夾作為prompt輸入。

輸入文字

倒是沒什麼太特別的。

輸入圖片+文字

輸入圖片,Gemini1.5 pro回傳結果的時間直接超過30秒。

我特意說它是錯的,它竟然承認。看來Gemini分辨是非的能力比較差。

輸入影片+文字

輸入視頻,Gemini1.5 pro的返回結果的時間超過200秒。

輸入檔+文字

輸入文件,Gemini1.5 pro回傳結果的時間也超過200秒。

輸入資料夾+文字

輸入資料夾,內容太多,再加上之前的內容,導致prompt的token超過限額,無法回傳結果。

總結

作為一個多模態的大模型,Gemini 1.5 pro比起1.0來,最明顯的特徵就是可以輸入的類型比較全面了。文字、圖片、影片、文件和資料夾。

但,似乎推理能力,並沒有明顯的進步。至少還是做不到分辨是非。

標籤:


copyright © www.lyustu.com all rights reserve.
Theme: TheMoon V3.0. Author:neo yang