最近 Decart AI 推出了一个交互式视频游戏大模型。简单的说,基于这个大模型,你玩的游戏,是根据你的行为 […]
从2022年年底到现在,接近两年的时间,AIGC产品从无到有,从简单的Chatbot套壳和单次generate […]
SAAS变了。 一直以来的卖席位,在AI SAAS领域,变成了订阅限量,也就是订阅后每个月renew一定的使用 […]
Nog een nieuw model voor de grote videogeneratie: Luma. Claimt video's van filmkwaliteit te kunnen genereren. Wat is Luma AI? Luma AI is […]
Kling AI is een groot model voor het genereren van video's, uitgebracht door Kuaishou, waarmee video's van maximaal 2 minuten kunnen worden gegenereerd. Het belangrijkste voordeel is dat Kuaishou's zelfontwikkelde 3D-expressie- en lichaamsreconstructietechnologie wordt gebruikt om uitdrukkingen en lichaamsbewegingen aan te sturen via een volledige lichaamsfoto van een personage. Kling AI is geschikt voor het genereren van scènes zoals video's van zingende en dansende personages en lange video's.
Overzicht Onlangs is een tekst-naar-spraak-model behoorlijk populair geworden: ChatTTS. Bovendien is dit model ontwikkeld door een klein team in China. concentreer op[…]
De release van GPT-4o markeert een nieuwe mijlpaal in hybride input-output grote modellen, met rijkere en snellere gesprekken. Het gratis gebruik en de lagere API-kosten maken deze technologie voor meer mensen toegankelijk. Vergeleken met Gemini 1.5 Pro is GPT-4o superieur in gesprekservaring en bevordert het de ontwikkeling van robots en AIGC-applicaties. Deze vooruitgang vertegenwoordigt een belangrijke ontwikkeling op het gebied van generatieve AI, waardoor nieuwe mogelijkheden ontstaan op gebieden zoals mens-computerinteractie en het genereren van inhoud.
Modellen voor videogeneratie zoals Sora en Stable Video Dissfusion worden vaak geconfronteerd met het probleem dat ze de uitgevoerde video niet nauwkeurig kunnen controleren, vooral wat betreft karakterbewegingen. Het bestuurbare videomodel kan de acties van personages in de video nauwkeurig besturen via prompte woorden. Viggle AI kan, als het eerste video-3D-model met daadwerkelijke fysieke begripsmogelijkheden, de bewegingen van personages vrijelijk controleren en is ingebed in het Discord-platform. Deze bestuurbare videotechnologie zal de kosten van digitale menselijke producten aanzienlijk verlagen en gediversifieerde digitale menselijke videocreatie mogelijk maken.
Na het testen van het onlangs geüpgradede multimodale AI-model Gemini 1.5 Pro ontdekten gebruikers dat, hoewel het een uitgebreider invoertype ondersteunt, inclusief tekst, afbeeldingen, video's, bestanden en mappen, het redeneervermogen niet significant is verbeterd, vooral niet bij het onderscheiden van recht van fout. Bovendien duurt de verwerking van invoer van video's, bestanden en mappen lang en zijn er beperkingen bij het verwerken van grote hoeveelheden gegevens.
Op 16 februari 2024 bracht Open AI zijn geavanceerde videogeneratiemodel uit, genaamd Sora, dat een interesse wekt die bijna vergelijkbaar is met die van GPT, dat nog niet beschikbaar is voor openbaar gebruik en Transformer- en diffusie-architecturen combineert voor high-fidelity videosimulaties TikTok demonstreert de mogelijkheden van Sora met onbewerkte video's van verschillende prompts, en geeft een voorproefje van de potentiële impact ervan op het snelgroeiende gebied van videogeneratie.