GPT-4o: бесплатные большие модели со смешанным вводом и выводом.
Обзор
GPT-4 имеет букву «о».
Выпущен GPT-4o.
Вы можете поговорить с ним голосом и позволить ему петь вам.
Особенности и преимущества GPT-4o
Смешанный вход и смешанный выход
Смешанный ввод означает, что вы можете одновременно вводить текст, изображения, голоса, видео и т. д.
Смешанный вывод означает, что GPT-4o может одновременно выводить текст, изображения, голос, видео и т. д.
Таким образом, ввод и вывод становятся богаче и удобнее для пользователя.
Быстрее
Скорость GPT-4o намного выше, чем у GPT-4 Turbo, почти так же быстро, как скорость реакции человека.
Два вышеуказанных пункта делают разговор с GPT-4o очень похожим на разговор с реальным человеком.
Цена ГПТ-4о
GPT-4o можно использовать бесплатно.
Плата за использование API также снизилась вдвое по сравнению с предыдущим.
GPT-4o против Gmini1.5 Pro
Gemini1.5 Pro также является большой моделью со смешанным вводом и выводом. Она была выпущена раньше, чем GPT-4o. Ее технология и производительность во всех аспектах практически такие же, как у GPT-4o.
Однако с точки зрения общения Gemini1.5 Pro явно хуже GPT-4o.
На самом деле это разумно. В конце концов, пользователей GPT гораздо больше, чем Gemini. В результате ежедневный объем разговоров в GPT намного больше, чем в Gemini. Со временем, естественно, возникнет разрыв.
Конечно, если вы просто генерируете контент, этот разрыв не будет таким очевидным.
Сценарии применения GPT-4o
робот
Появление крупных моделей, таких как GPT, напрямую способствовало развитию индустрии роботов.
GPT-4o делает общение практически таким же, как у реальных людей, что определенно принесет новое развитие в роботоиндустрию.
Приложение AIGC
GPT-4o обеспечивает хороший интерфейс для различных приложений AIGC. Существует множество приложений AIGC, которые одновременно генерируют смешанный контент, например текст, изображения и голос. Может появиться большое количество приложений AIGC.
в заключение
Появление крупных моделей со смешанными входными и выходными данными, таких как GPT-4o и Gemini1.5 Pro, является большим прогрессом для генеративного ИИ.