最近 Decart AI 推出了一个交互式视频游戏大模型。简单的说,基于这个大模型,你玩的游戏,是根据你的行为 […]
从2022年年底到现在,接近两年的时间,AIGC产品从无到有,从简单的Chatbot套壳和单次generate […]
SAAS变了。 一直以来的卖席位,在AI SAAS领域,变成了订阅限量,也就是订阅后每个月renew一定的使用 […]
Başka bir yeni büyük video oluşturma modeli - Luma. Film kalitesinde videolar oluşturabildiğini iddia ediyor. Luma AI nedir? Luma AI […]
Kling AI, Kuaishou tarafından piyasaya sürülen ve 2 dakikaya kadar video oluşturabilen büyük bir video oluşturma modelidir. Başlıca avantajı, bir karakterin tam vücut fotoğrafı aracılığıyla ifadeleri ve vücut hareketlerini yönlendirmek için Kuaishou'nun kendi geliştirdiği 3 boyutlu ifade ve vücut yeniden yapılandırma teknolojisini kullanmaktır. Kling AI, şarkı söyleyen ve dans eden karakterlerin videoları ve uzun videolar gibi sahneler oluşturmak için uygundur.
概述 最近,一个文本转语音的模型比较火,那就是:ChatTTS。而且,这个模型还是国内的一个小团队搞的。专注于 […]
GPT-4o'nun piyasaya sürülmesi, daha zengin ve daha hızlı konuşmalarla hibrit giriş-çıkış büyük modellerinde yeni bir dönüm noktasına işaret ediyor. Ücretsiz kullanımı ve indirimli API ücretleri, bu teknolojinin daha fazla kişi tarafından erişilebilir olmasını sağlıyor. Gemini1.5 Pro ile karşılaştırıldığında GPT-4o, konuşma deneyimi açısından üstündür ve robotların ve AIGC uygulamalarının geliştirilmesini destekler. Bu ilerleme, üretken yapay zeka alanında önemli bir gelişmeyi temsil ediyor ve insan-bilgisayar etkileşimi ve içerik üretimi gibi alanlara yeni olanaklar getiriyor.
Sora ve Stable Video Dissfusion gibi video oluşturma modelleri sıklıkla, özellikle karakter hareketlerinde çıkış videosunu doğru şekilde kontrol edememe sorunuyla karşı karşıyadır. Kontrol edilebilir video modeli, hızlı sözcükler aracılığıyla videodaki karakterlerin eylemlerini doğru bir şekilde kontrol edebilir. Gerçek fiziksel anlama yeteneklerine sahip ilk video-3D modeli olan Viggle AI, karakter hareketlerini serbestçe kontrol edebilir ve Discord platformuna yerleştirilmiştir. Bu kontrol edilebilir video teknolojisi, dijital insan ürünlerinin maliyetini önemli ölçüde azaltacak ve çeşitlendirilmiş dijital insan videosu oluşturulmasına olanak sağlayacak.
Yeni yükseltilen çok modlu yapay zeka modeli Gemini 1.5 Pro'yu test ettikten sonra kullanıcılar, metin, resimler, videolar, dosyalar ve klasörler dahil olmak üzere daha kapsamlı bir giriş türünü desteklemesine rağmen, özellikle doğru olanı ayırt etme konusunda akıl yürütme yeteneğinin önemli ölçüde gelişmediğini buldu. yanlış. Ayrıca video, dosya ve klasör girişlerinin işlenmesi uzun zaman alır ve büyük miktarda verinin işlenmesinde sınırlamalar vardır.
16 Şubat 2024'te Open AI, Sora adlı gelişmiş video oluşturma modelini piyasaya sürdü ve neredeyse GPT'ye rakip olacak bir ilgi uyandırdı. Henüz genel kullanıma sunulmayan Sora, yüksek kaliteli video simülasyonu için Transformer ve difüzyon mimarilerini birleştiriyor. TikTok, Sora'nın yeteneklerini çeşitli istemlerden alınan düzenlenmemiş videolarla sergiliyor ve onun gelişen video oluşturma alanındaki potansiyel etkisini önizliyor.