GPT-4o: Gratis store modeller med blandet input og blandet output
Oversigt
GPT-4 har et "o".
GPT-4o er frigivet.
Du kan tale til den gennem stemmen og lade den synge for dig.
Funktioner og fordele ved GPT-4o
Blandet input og blandet output
Blandet input betyder, at du kan indtaste tekst, billeder, stemmer, videoer osv. på samme tid
Blandet output betyder, at GPT-4o kan udsende tekst, billeder, stemme, video osv. på samme tid.
På denne måde bliver input og output rigere og mere brugervenligt.
hurtigere
Hastigheden af GPT-4o er meget hurtigere end GPT-4 Turbo, næsten lige så hurtig som menneskelig reaktionshastighed.
Ovenstående to punkter gør samtalen med GPT-4o meget lig en samtale med en virkelig person.
Pris på GPT-4o
GPT-4o er gratis at bruge.
Dets API-brugsgebyr er også blevet reduceret med det halve i forhold til tidligere.
GPT-4o VS Gmini1.5 Pro
Gemini1.5 Pro er også en stor model med blandet input og blandet output. Den blev udgivet tidligere end GPT-4o. Dens teknologi og ydeevne i alle aspekter er faktisk næsten den samme som GPT-4o.
Med hensyn til samtaleoplevelse er Gemini1.5 Pro dog naturligvis værre end GPT-4o.
Faktisk er dette rimeligt, når alt kommer til alt, er der mange flere brugere, der bruger GPT end Gemini. Dette resulterer i, at den daglige samtalemængde for GPT er meget større end for Gemini.
Selvfølgelig, hvis du bare genererer indhold, vil dette hul ikke være så tydeligt.
Anvendelsesscenarier for GPT-4o
robot
Fremkomsten af store modeller som GPT har direkte fremmet udviklingen af robotindustrien.
GPT-4o gør samtaleoplevelsen næsten den samme som for rigtige mennesker, hvilket helt sikkert vil bringe ny udvikling til robotindustrien.
AIGC ansøgning
GPT-4o giver en god grænseflade til forskellige AIGC-applikationer. Der er mange AIGC-applikationer, der genererer blandet indhold som tekst, billeder og stemmer på samme tid.
Afslutningsvis
Fremkomsten af store modeller med blandet input og blandet output som GPT-4o og Gemini1.5 Pro er et stort fremskridt for generativ AI.