Log in

    Internetkijken

    Oasis AI: 交互式视频游戏大模型

    最近 Decart AI 推出了一个交互式视频游戏大模型。简单的说,基于这个大模型,你玩的游戏,是根据你的行为 […]

    AI heeft alleen Chat? ——AIGC-productevolutietheorie

    从2022年年底到现在,接近两年的时间,AIGC产品从无到有,从简单的Chatbot套壳和单次generate […]

    Abonnementslimieten voor AI SAAS: een nieuw bedrijfsmodel voor SAAS

    SAAS变了。 一直以来的卖席位,在AI SAAS领域,变成了订阅限量,也就是订阅后每个月renew一定的使用 […]

    Luma: Een groot model voor het genereren van video's voor video's van filmkwaliteit

    Nog een nieuw model voor de grote videogeneratie: Luma. Claimt video's van filmkwaliteit te kunnen genereren. Wat is Luma AI? Luma AI is […]

    Kling AI: Kuaishou's grote videogeneratiemodel is vergelijkbaar met Sora

    Kling AI is een groot model voor het genereren van video's, uitgebracht door Kuaishou, waarmee video's van maximaal 2 minuten kunnen worden gegenereerd. Het belangrijkste voordeel is dat Kuaishou's zelfontwikkelde 3D-expressie- en lichaamsreconstructietechnologie wordt gebruikt om uitdrukkingen en lichaamsbewegingen aan te sturen via een volledige lichaamsfoto van een personage. Kling AI is geschikt voor het genereren van scènes zoals video's van zingende en dansende personages en lange video's.

    ChatTTS: Tekst-naar-spraakmodel voor gespreksscenario's

    Overzicht Onlangs is een tekst-naar-spraak-model behoorlijk populair geworden: ChatTTS. Bovendien is dit model ontwikkeld door een klein team in China. concentreer op[…]

    GPT-4o: Gratis grote modellen met gemengde input en gemengde output

    De release van GPT-4o markeert een nieuwe mijlpaal in hybride input-output grote modellen, met rijkere en snellere gesprekken. Het gratis gebruik en de lagere API-kosten maken deze technologie voor meer mensen toegankelijk. Vergeleken met Gemini 1.5 Pro is GPT-4o superieur in gesprekservaring en bevordert het de ontwikkeling van robots en AIGC-applicaties. Deze vooruitgang vertegenwoordigt een belangrijke ontwikkeling op het gebied van generatieve AI, waardoor nieuwe mogelijkheden ontstaan op gebieden zoals mens-computerinteractie en het genereren van inhoud.

    Viggle AI: video's genereren met bestuurbare karakterbewegingen

    Modellen voor videogeneratie zoals Sora en Stable Video Dissfusion worden vaak geconfronteerd met het probleem dat ze de uitgevoerde video niet nauwkeurig kunnen controleren, vooral wat betreft karakterbewegingen. Het bestuurbare videomodel kan de acties van personages in de video nauwkeurig besturen via prompte woorden. Viggle AI kan, als het eerste video-3D-model met daadwerkelijke fysieke begripsmogelijkheden, de bewegingen van personages vrijelijk controleren en is ingebed in het Discord-platform. Deze bestuurbare videotechnologie zal de kosten van digitale menselijke producten aanzienlijk verlagen en gediversifieerde digitale menselijke videocreatie mogelijk maken.

    Google Gemini 1.5 Pro persoonlijke test: krachtig en kwetsbaar tegelijk

    Na het testen van het onlangs geüpgradede multimodale AI-model Gemini 1.5 Pro ontdekten gebruikers dat, hoewel het een uitgebreider invoertype ondersteunt, inclusief tekst, afbeeldingen, video's, bestanden en mappen, het redeneervermogen niet significant is verbeterd, vooral niet bij het onderscheiden van recht van fout. Bovendien duurt de verwerking van invoer van video's, bestanden en mappen lang en zijn er beperkingen bij het verwerken van grote hoeveelheden gegevens.

    Hot topics in februari 2024: Sora - Open AI's grote videogeneratiemodel

    Op 16 februari 2024 bracht Open AI zijn geavanceerde videogeneratiemodel uit, genaamd Sora, dat een interesse wekt die bijna vergelijkbaar is met die van GPT, dat nog niet beschikbaar is voor openbaar gebruik en Transformer- en diffusie-architecturen combineert voor high-fidelity videosimulaties TikTok demonstreert de mogelijkheden van Sora met onbewerkte video's van verschillende prompts, en geeft een voorproefje van de potentiële impact ervan op het snelgroeiende gebied van videogeneratie.



    copyright © www.lyustu.com alle rechten voorbehouden.
    Thema: TheMoon V3.0. Auteur: neo yang