GPT-4o:免費的混合輸入和混合輸出大模型

作者：neo yang 時間：2024/05/15 讀： 13806

GPT-4o的發布標誌著混合輸入輸出大模型的新里程碑，對話更豐富、更快。其免費使用和降低的API費用使更多人能夠接觸到這項技術。相較於Gemini1.5 Pro，GPT-4o在對話體驗上更勝一籌，推動了機器人和AIGC應用的發展。這項進步代表著生成式AI領域的重要發展，為人機互動和內容生成等領域帶來了新的可能性。

概述

GPT-4 「o」了。

GPT-4o發布了。

你可以透過語音和它對話，可以讓它為你唱歌了。

GPT-4o的特徵和優勢

混合輸入和混合輸出

混合輸入，就是你可以同時輸入文字、圖像、語音、視訊等

混合輸出，就是GPT-4o可以同時輸出文字、影像、語音、視訊等。

這樣一來，輸入和輸出更加豐富，更加人性化。

速度更快

GPT-4o的速度比GPT-4 Turbo快了不少，幾乎跟人類的反應速度差不多了。

以上兩點，使得和GPT-4o的對話，和真人對話很相似。

GPT-4o的價格

GPT-4o可以免費使用。

它的API使用費也比之前降低了一半。

GPT-4o VS Gmini1.5 Pro

同樣是混合輸入和混合輸出的大模型Gemini1.5 Pro，發佈時間要早於GPT-4o，技術和各方面的性能其實和GPT-4o相差無幾。

然而，在對話的體驗方面，Gemini1.5 Pro要明顯的比GPT-4o差一些。

其實，這也是情理之中的，畢竟使用GPT的用戶比使用Gemini的用戶多太多了，這就導致GPT每天的對話量遠大於Gemini，時間一長，自然就會有差距。

當然，如果只是生成內容，其實這種差距就不會那麼明顯了。

GPT-4o的應用場景

機器人

GPT等大模型的出現，直接推動了機器人產業的發展。

GPT-4o將對話體驗做到了和真人幾乎一樣，那麼必將讓機器人產業有新的發展。

AIGC應用

GPT-4o為各種AIGC應用提供了一個好的接口，有很多同時會產生文字、圖片、語音等混合內容AIGC應用程式可能會大量出現。

結論

GPT-4o和Gemini1.5 Pro這樣的混合輸入和混合輸出的大模型的出現，對於生成式AI來說是一次大的進步。

參考

https://openai.com/index/hello-gpt-4o/

標籤：AIGC

关注我的微信公众号