Internetkijken

ChatTTS: Tekst-naar-spraakmodel voor gespreksscenario's

Overzicht Onlangs is een tekst-naar-spraak-model behoorlijk populair geworden: ChatTTS. Bovendien is dit model ontwikkeld door een klein team in China. concentreer op[…]

GPT-4o: Gratis grote modellen met gemengde input en gemengde output

De release van GPT-4o markeert een nieuwe mijlpaal in hybride input-output grote modellen, met rijkere en snellere gesprekken. Het gratis gebruik en de lagere API-kosten maken deze technologie voor meer mensen toegankelijk. Vergeleken met Gemini 1.5 Pro is GPT-4o superieur in gesprekservaring en bevordert het de ontwikkeling van robots en AIGC-applicaties. Deze vooruitgang vertegenwoordigt een belangrijke ontwikkeling op het gebied van generatieve AI, waardoor nieuwe mogelijkheden ontstaan op gebieden zoals mens-computerinteractie en het genereren van inhoud.

Viggle AI: video's genereren met bestuurbare karakterbewegingen

Modellen voor videogeneratie zoals Sora en Stable Video Dissfusion worden vaak geconfronteerd met het probleem dat ze de uitgevoerde video niet nauwkeurig kunnen controleren, vooral wat betreft karakterbewegingen. Het bestuurbare videomodel kan de acties van personages in de video nauwkeurig besturen via prompte woorden. Viggle AI kan, als het eerste video-3D-model met daadwerkelijke fysieke begripsmogelijkheden, de bewegingen van personages vrijelijk controleren en is ingebed in het Discord-platform. Deze bestuurbare videotechnologie zal de kosten van digitale menselijke producten aanzienlijk verlagen en gediversifieerde digitale menselijke videocreatie mogelijk maken.

Google Gemini 1.5 Pro persoonlijke test: krachtig en kwetsbaar tegelijk

Na het testen van het onlangs geüpgradede multimodale AI-model Gemini 1.5 Pro ontdekten gebruikers dat, hoewel het een uitgebreider invoertype ondersteunt, inclusief tekst, afbeeldingen, video's, bestanden en mappen, het redeneervermogen niet significant is verbeterd, vooral niet bij het onderscheiden van recht van fout. Bovendien duurt de verwerking van invoer van video's, bestanden en mappen lang en zijn er beperkingen bij het verwerken van grote hoeveelheden gegevens.

Hot topics in februari 2024: Sora - Open AI's grote videogeneratiemodel

Op 16 februari 2024 bracht Open AI zijn geavanceerde videogeneratiemodel uit, genaamd Sora, dat een interesse wekt die bijna vergelijkbaar is met die van GPT, dat nog niet beschikbaar is voor openbaar gebruik en Transformer- en diffusie-architecturen combineert voor high-fidelity videosimulaties TikTok demonstreert de mogelijkheden van Sora met onbewerkte video's van verschillende prompts, en geeft een voorproefje van de potentiële impact ervan op het snelgroeiende gebied van videogeneratie.

Gemini 1.5 pro: Hoe aan te vragen

Google Gemini1.5 pro overzicht Google Gemini1.5 pro op 15 februari 2024 […]

Hot topics in januari 2024: palworld

1. Google Trends: Vergelijk “AI”, “gpt”, “palworld” Dit is een screenshot van vandaag (31/01/2024). […]

新版WordPress体验:用SAAS、低代码和无代码的方式构建网站

2023年11月06日,Wordpress v6.4.2发布。 两天后,我迁移自己的博客到别的服务器上。之后顺 […]

第一波AIGC创业团队解散了,AIGC还有戏吗?

今天,有朋友分享了一篇文章,近期,最早做AIGC的独角兽企业Jasper,归零了。Jasper,基于GPT,相 […]

生成式AI的方向——机器人的突破

  AI是个大机会。所以,大家都在探索,无论知道做什么的,还是不知道做什么的。目前,探索的方向主要在 […]



copyright © www.lyustu.com alle rechten voorbehouden.
Thema: TheMoon V3.0. Auteur: neo yang