GPT-4o: Kostenlose große Modelle mit gemischter Eingabe und gemischter Ausgabe
Überblick
GPT-4 hat ein „o“.
GPT-4o wird veröffentlicht.
Sie können mit der Stimme mit ihm sprechen und ihn für sich singen lassen.
Funktionen und Vorteile von GPT-4o
Gemischter Input und gemischter Output
Gemischte Eingabe bedeutet, dass Sie gleichzeitig Text, Bilder, Stimmen, Videos usw. eingeben können
Gemischte Ausgabe bedeutet, dass GPT-4o gleichzeitig Text, Bilder, Sprache, Video usw. ausgeben kann.
Auf diese Weise sind Eingabe und Ausgabe umfangreicher und benutzerfreundlicher.
Schneller
Die Geschwindigkeit von GPT-4o ist viel schneller als die von GPT-4 Turbo, fast so schnell wie die menschliche Reaktionsgeschwindigkeit.
Die beiden oben genannten Punkte machen das Gespräch mit GPT-4o einem Gespräch mit einer echten Person sehr ähnlich.
Preis von GPT-4o
Die Nutzung von GPT-4o ist kostenlos.
Auch die API-Nutzungsgebühr wurde im Vergleich zu zuvor um die Hälfte reduziert.
GPT-4o VS Gmini1.5 Pro
Gemini1.5 Pro ist ebenfalls ein großes Modell mit gemischter Eingabe und gemischter Ausgabe. Es wurde früher als GPT-4o veröffentlicht. Seine Technologie und Leistung sind tatsächlich in allen Aspekten mit denen von GPT-4o identisch.
Allerdings ist Gemini1.5 Pro in Bezug auf das Gesprächserlebnis offensichtlich schlechter als GPT-4o.
Tatsächlich ist dies vernünftig, da es viel mehr Benutzer gibt, die GPT verwenden als Gemini. Dies führt dazu, dass das tägliche Konversationsvolumen von GPT viel größer ist als das von Gemini.
Wenn Sie nur Inhalte generieren, wird diese Lücke natürlich nicht so offensichtlich sein.
Anwendungsszenarien von GPT-4o
Roboter
Das Aufkommen großer Modelle wie GPT hat die Entwicklung der Roboterindustrie direkt vorangetrieben.
Durch GPT-4o ist das Gesprächserlebnis fast das gleiche wie das von echten Menschen, was definitiv neue Entwicklungen in der Roboterbranche bringen wird.
AIGC-Anwendung
GPT-4o bietet eine gute Schnittstelle für verschiedene AIGC-Anwendungen. Es gibt viele AIGC-Anwendungen, die gleichzeitig Text, Bilder und Stimmen generieren.
abschließend
Das Aufkommen großer Modelle mit gemischtem Input und gemischtem Output wie GPT-4o und Gemini1.5 Pro ist ein großer Fortschritt für generative KI.