登入

    網路觀察

    ChatTTS: 對話場景的文字轉語音模型

    概述最近,一個文字轉語音的模型比較火,那就是:ChatTTS。而且,這個模型還是國內的小團隊搞的。專注於[…]

    GPT-4o:免費的混合輸入和混合輸出大模型

    GPT-4o的發布標誌著混合輸入輸出大模型的新里程碑,對話更豐富、更快。其免費使用和降低的API費用使更多人能夠接觸到這項技術。相較於Gemini1.5 Pro,GPT-4o在對話體驗上更勝一籌,推動了機器人和AIGC應用的發展。這項進步代表著生成式AI領域的重要發展,為人機互動和內容生成等領域帶來了新的可能性。

    Viggle AI: 如何產生人物動作可控的視頻

    影片生成模型如Sora和Stable Video Dissfusion常面臨無法精準控制輸出影片的問題,尤其是在人物動作上。可控視訊模型能透過提示詞精確控制影片中的人物動作。 Viggle AI,作為首個具備實際物理理解能力的影片-3D模型,能自由控制角色動作,並植入於Discord平台。這種可控視訊技術將顯著降低數位人產品成本,並實現多樣化的數位人視訊創作。

    Google Gemini 1.5 Pro親測:強大與脆弱並存

    使用者在測試新升級的多模態AI模型Gemini 1.5 Pro後發現,儘管它支援更全面的輸入類型包括文字、圖片、影片、檔案和資料夾,推理能力卻沒有顯著提升,特別在分辨是非方面。此外,處理影片、文件和資料夾輸入時耗時較長,且對大量資料的處理有限制。

    2024年02月熱點:Sora——Open AI的影片生成大模型

    On February 16, 2024, Open AI released its advanced video generation model named Sora, sparking interest almost rivalling that of GPT. Sora, which is not yet available for public opuse, combines Transformer andsvidctures s格, s. TikTok showcases Sora's capabilities with unedited videos from various prompts, previewing its potential impact in the burgeoning video generation field.

    Gemini 1.5 pro:如何申請

    Google Gemini1.5 pro概述Google Gemini1.5 pro於2024年02月15日[…]

    2024年一月熱點:palworld

    一、Google趨勢:對比“AI”,“gpt”,“palworld” 這是今天(2024/01/31)的截圖。 […]

    新版WordPress體驗:用SAAS、低程式碼和無程式碼的方式建構網站

    2023年11月06日,Wordpress v6.4.2發布。兩天后,我遷移自己的部落格到別的伺服器。之後順[…]

    第一波AIGC創業團隊解散了,AIGC還有戲嗎?

    今天,有朋友分享了一篇文章,近期,最早做AIGC的獨角獸企業Jasper,歸零了。 Jasper,基於GPT,相[…]

    生成式AI的方向-機器人的突破

      AI是個大機會。所以,大家都在探索,無論知道做什麼的,還是不知道做什麼的。目前,探索的方向主要在[…]



    copyright © www.lyustu.com all rights reserve.
    Theme: TheMoon V3.0. Author:neo yang