概述 最近,一个文本转语音的模型比较火,那就是:ChatTTS。而且,这个模型还是国内的一个小团队搞的。专注于 […]
GPT-4o'nun piyasaya sürülmesi, daha zengin ve daha hızlı konuşmalarla hibrit giriş-çıkış büyük modellerinde yeni bir dönüm noktasına işaret ediyor. Ücretsiz kullanımı ve indirimli API ücretleri, bu teknolojinin daha fazla kişi tarafından erişilebilir olmasını sağlıyor. Gemini1.5 Pro ile karşılaştırıldığında GPT-4o, konuşma deneyimi açısından üstündür ve robotların ve AIGC uygulamalarının geliştirilmesini destekler. Bu ilerleme, üretken yapay zeka alanında önemli bir gelişmeyi temsil ediyor ve insan-bilgisayar etkileşimi ve içerik üretimi gibi alanlara yeni olanaklar getiriyor.
Sora ve Stable Video Dissfusion gibi video oluşturma modelleri sıklıkla, özellikle karakter hareketlerinde çıkış videosunu doğru şekilde kontrol edememe sorunuyla karşı karşıyadır. Kontrol edilebilir video modeli, hızlı sözcükler aracılığıyla videodaki karakterlerin eylemlerini doğru bir şekilde kontrol edebilir. Gerçek fiziksel anlama yeteneklerine sahip ilk video-3D modeli olan Viggle AI, karakter hareketlerini serbestçe kontrol edebilir ve Discord platformuna yerleştirilmiştir. Bu kontrol edilebilir video teknolojisi, dijital insan ürünlerinin maliyetini önemli ölçüde azaltacak ve çeşitlendirilmiş dijital insan videosu oluşturulmasına olanak sağlayacak.
Yeni yükseltilen çok modlu yapay zeka modeli Gemini 1.5 Pro'yu test ettikten sonra kullanıcılar, metin, resimler, videolar, dosyalar ve klasörler dahil olmak üzere daha kapsamlı bir giriş türünü desteklemesine rağmen, özellikle doğru olanı ayırt etme konusunda akıl yürütme yeteneğinin önemli ölçüde gelişmediğini buldu. yanlış. Ayrıca video, dosya ve klasör girişlerinin işlenmesi uzun zaman alır ve büyük miktarda verinin işlenmesinde sınırlamalar vardır.
16 Şubat 2024'te Open AI, Sora adlı gelişmiş video oluşturma modelini piyasaya sürdü ve neredeyse GPT'ye rakip olacak bir ilgi uyandırdı. Henüz genel kullanıma sunulmayan Sora, yüksek kaliteli video simülasyonu için Transformer ve difüzyon mimarilerini birleştiriyor. TikTok, Sora'nın yeteneklerini çeşitli istemlerden alınan düzenlenmemiş videolarla sergiliyor ve onun gelişen video oluşturma alanındaki potansiyel etkisini önizliyor.
Google Gemini1.5 pro'ya genel bakış Google Gemini1.5 pro, 15 Şubat 2024 […]
1. Google Trendler: “AI”, “gpt”, ”palworld”ü karşılaştırın Bu bugünün (2024/01/31) ekran görüntüsüdür. […]
6 Kasım 2023'te WordPress v6.4.2 yayınlandı. İki gün sonra blogumu başka bir sunucuya taşıdım. Daha sonra […]
Bugün bir arkadaşım bir yazı paylaştı. Geçtiğimiz günlerde AIGC yapan ilk unicorn şirketi olan Jasper sıfıra döndü. Jasper, GPT'yi temel alarak […]
Yapay zeka büyük bir fırsat. Dolayısıyla herkes ne yapacağını bilse de, ne yapacağını bilmese de araştırıyor. Şu anda, keşif yönü esas olarak […]