概述最近,一個文字轉語音的模型比較火,那就是:ChatTTS。而且,這個模型還是國內的小團隊搞的。專注於[…]
GPT-4o的發布標誌著混合輸入輸出大模型的新里程碑,對話更豐富、更快。其免費使用和降低的API費用使更多人能夠接觸到這項技術。相較於Gemini1.5 Pro,GPT-4o在對話體驗上更勝一籌,推動了機器人和AIGC應用的發展。這項進步代表著生成式AI領域的重要發展,為人機互動和內容生成等領域帶來了新的可能性。
影片生成模型如Sora和Stable Video Dissfusion常面臨無法精準控制輸出影片的問題,尤其是在人物動作上。可控視訊模型能透過提示詞精確控制影片中的人物動作。 Viggle AI,作為首個具備實際物理理解能力的影片-3D模型,能自由控制角色動作,並植入於Discord平台。這種可控視訊技術將顯著降低數位人產品成本,並實現多樣化的數位人視訊創作。
使用者在測試新升級的多模態AI模型Gemini 1.5 Pro後發現,儘管它支援更全面的輸入類型包括文字、圖片、影片、檔案和資料夾,推理能力卻沒有顯著提升,特別在分辨是非方面。此外,處理影片、文件和資料夾輸入時耗時較長,且對大量資料的處理有限制。
On February 16, 2024, Open AI released its advanced video generation model named Sora, sparking interest almost rivalling that of GPT. Sora, which is not yet available for public opuse, combines Transformer andsvidctures s格, s. TikTok showcases Sora's capabilities with unedited videos from various prompts, previewing its potential impact in the burgeoning video generation field.
Google Gemini1.5 pro概述Google Gemini1.5 pro於2024年02月15日[…]
一、Google趨勢:對比“AI”,“gpt”,“palworld” 這是今天(2024/01/31)的截圖。 […]
2023年11月06日,Wordpress v6.4.2發布。兩天后,我遷移自己的部落格到別的伺服器。之後順[…]
今天,有朋友分享了一篇文章,近期,最早做AIGC的獨角獸企業Jasper,歸零了。 Jasper,基於GPT,相[…]
AI是個大機會。所以,大家都在探索,無論知道做什麼的,還是不知道做什麼的。目前,探索的方向主要在[…]