Zaloguj sie

    Zegarek internetowy

    Oasis AI: 交互式视频游戏大模型

    最近 Decart AI 推出了一个交互式视频游戏大模型。简单的说,基于这个大模型,你玩的游戏,是根据你的行为 […]

    AI ma tylko czat? ——Teoria ewolucji produktów AIGC

    Od końca 2022 roku do chwili obecnej, w ciągu prawie dwóch lat, produkty AIGC zostały opracowane od podstaw, od prostej powłoki Chatbota po pojedynczy moduł generujący […]

    AI SAAS的订阅限量:SAAS的新商业模式

    SAAS变了。 一直以来的卖席位,在AI SAAS领域,变成了订阅限量,也就是订阅后每个月renew一定的使用 […]

    Luma: duży model do generowania filmów o jakości filmowej

    Kolejny nowy model dużej generacji wideo - Luma. Twierdzi, że jest w stanie generować filmy o jakości filmowej. Co to jest Luma AI? Luma AI to […]

    Kling AI: Duży model generowania wideo Kuaishou jest porównywalny z Sorą

    Kling AI to duży model generowania wideo wydany przez Kuaishou, który może generować filmy o długości do 2 minut. Jego główną zaletą jest wykorzystanie opracowanej przez Kuaishou technologii ekspresji 3D i rekonstrukcji ciała w celu przeniesienia ekspresji i ruchów ciała na zdjęcie całego ciała postaci. Kling AI nadaje się do generowania scen, takich jak filmy przedstawiające śpiewające i tańczące postacie oraz długie filmy.

    ChatTTS: model zamiany tekstu na mowę dla scenariuszy konwersacyjnych

    Przegląd Ostatnio dość popularny stał się model zamiany tekstu na mowę: ChatTTS. Co więcej, model ten został opracowany przez mały zespół w Chinach. skupić się na[…]

    GPT-4o: Darmowe duże modele z mieszanym wejściem i mieszanym wyjściem

    Wypuszczenie GPT-4o stanowi nowy kamień milowy w dużych modelach z hybrydowym wejściem i wyjściem, zapewniającymi bogatsze i szybsze rozmowy. Bezpłatne korzystanie i obniżone opłaty za API sprawiają, że technologia ta jest dostępna dla większej liczby osób. W porównaniu z Gemini1.5 Pro, GPT-4o zapewnia lepsze wrażenia z rozmów, promując rozwój robotów i aplikacji AIGC. Postęp ten stanowi ważny postęp w dziedzinie generatywnej sztucznej inteligencji, otwierając nowe możliwości w takich obszarach, jak interakcja człowiek-komputer i generowanie treści.

    Viggle AI: Jak generować filmy z kontrolowanymi ruchami postaci

    Modele generowania wideo, takie jak Sora i Stable Video Dissfusion, często borykają się z problemem braku możliwości dokładnej kontroli wyjściowego wideo, szczególnie w przypadku ruchów postaci. Sterowany model wideo może dokładnie kontrolować działania postaci w filmie za pomocą podpowiedzi. Viggle AI, jako pierwszy model wideo-3D z rzeczywistymi możliwościami rozumienia fizycznego, może swobodnie kontrolować ruchy postaci i jest osadzony w platformie Discord. Ta kontrolowana technologia wideo znacznie obniży koszty cyfrowych produktów ludzkich i umożliwi zróżnicowane tworzenie cyfrowych filmów wideo.

    Osobisty test Google Gemini 1.5 Pro: mocny i delikatny jednocześnie

    Po przetestowaniu nowo ulepszonego, multimodalnego modelu AI Gemini 1.5 Pro użytkownicy odkryli, że chociaż obsługuje on bardziej wszechstronne typy danych wejściowych, w tym tekst, obrazy, filmy, pliki i foldery, zdolność rozumowania nie uległa znaczącej poprawie, szczególnie w zakresie odróżniania od zło. Ponadto przetwarzanie danych wejściowych wideo, plików i folderów zajmuje dużo czasu, a obsługa dużych ilości danych wiąże się z ograniczeniami.

    Gorące tematy w lutym 2024 r.: Sora – model generowania dużych plików wideo w ramach Open AI

    16 lutego 2024 r. Open AI wypuściło swój zaawansowany model generowania wideo o nazwie Sora, wywołując zainteresowanie niemal dorównujące modelowi GPT, który nie jest jeszcze dostępny do użytku publicznego, łączy architekturę transformatorową i dyfuzyjną do symulacji wideo o wysokiej wierności TikTok prezentuje możliwości Sory za pomocą nieedytowanych filmów z różnych podpowiedzi, podglądając jej potencjalny wpływ na rozwijającą się dziedzinę generowania wideo.



    prawa autorskie © www.lyustu.com wszelkie prawa zastrzeżone.
    Temat: TheMoon V3.0 Autor:neo yang