Google Gemini 1.5 Pro 개인 테스트: 강력하면서도 취약함
새롭게 업그레이드된 멀티모달 AI 모델인 Gemini 1.5 Pro를 테스트한 결과 사용자는 텍스트, 사진, 비디오, 파일 및 폴더를 포함한 보다 포괄적인 입력 유형을 지원하지만 추론 능력, 특히 오른쪽과 오른쪽을 구별하는 능력이 크게 향상되지 않았다는 사실을 발견했습니다. 잘못된. 또한, 영상, 파일, 폴더 입력을 처리하는 데 시간이 오래 걸리고, 대용량 데이터를 처리하는데 한계가 있습니다.
개요
前段时间,申请了一下Gemini 1.5 Pro的wishlist。之后,就忘到一边去了。今天登录了一下Google AI Studio,发现,我已经可以用Gemini 1.5 pro了。于是,测试了一下。后边准备把现在正在用的Gemini 1.0 pro切换到Gemini 1.5 pro。
Gemini 1.5 pro 可以支持文字、图片、视频、文件、文件夹作为prompt输入。
输入文字
倒是没什么太特别的。
输入图片+文字
输入图片,Gemini1.5 pro返回结果的时间直接超过30秒。
我特意说它是错的,它竟然承认。看来Gemini分辨是非的能力比较差。
输入视频+文字
输入视频,Gemini1.5 pro的返回结果的时间超过200秒。
输入文件+文字
输入文件,Gemini1.5 pro返回结果的时间也超过200秒。
输入文件夹+文字
输入文件夹,内容太多,再加上之前的内容,导致prompt的token超过限额,无法返回结果。
요약하다
作为一个多模态的大模型,Gemini 1.5 pro比起1.0来,最明显的特点就是可以输入的类型比较全面了。文字、图片、视频、文件和文件夹。
但,似乎推理能力,并没有明显的进步。至少还是做不到分辨是非。