Google Gemini 1.5 Pro親測:強大與脆弱並存
使用者在測試新升級的多模態AI模型Gemini 1.5 Pro後發現,儘管它支援更全面的輸入類型包括文字、圖片、影片、檔案和資料夾,推理能力卻沒有顯著提升,特別在分辨是非方面。此外,處理影片、文件和資料夾輸入時耗時較長,且對大量資料的處理有限制。
概述
前段時間,申請了一下Gemini 1.5 Pro的wishlist。之後,就忘到一邊去了。今天登入了一下Google AI Studio,發現,我已經可以用Gemini 1.5 pro了。於是,測試了一下。後邊準備把現在正在使用的Gemini 1.0 pro切換到Gemini 1.5 pro。
Gemini 1.5 pro 可以支援文字、圖片、影片、檔案、資料夾作為prompt輸入。
輸入文字
倒是沒什麼太特別的。
輸入圖片+文字
輸入圖片,Gemini1.5 pro回傳結果的時間直接超過30秒。
我特意說它是錯的,它竟然承認。看來Gemini分辨是非的能力比較差。
輸入影片+文字
輸入視頻,Gemini1.5 pro的返回結果的時間超過200秒。
輸入檔+文字
輸入文件,Gemini1.5 pro回傳結果的時間也超過200秒。
輸入資料夾+文字
輸入資料夾,內容太多,再加上之前的內容,導致prompt的token超過限額,無法回傳結果。
總結
作為一個多模態的大模型,Gemini 1.5 pro比起1.0來,最明顯的特徵就是可以輸入的類型比較全面了。文字、圖片、影片、文件和資料夾。
但,似乎推理能力,並沒有明顯的進步。至少還是做不到分辨是非。