最近 Decart AI 推出了一个交互式视频游戏大模型。简单的说,基于这个大模型,你玩的游戏,是根据你的行为 […]
从2022年年底到现在,接近两年的时间,AIGC产品从无到有,从简单的Chatbot套壳和单次generate […]
SAAS变了。 一直以来的卖席位,在AI SAAS领域,变成了订阅限量,也就是订阅后每个月renew一定的使用 […]
또 다른 새로운 대형 비디오 생성 모델 - Luma. 영화 품질의 비디오를 생성할 수 있다고 주장합니다. 루마 AI란 무엇인가요? 루마 AI는 […]
Kling AI는 Kuaishou가 출시한 대형 동영상 생성 모델로, 최대 2분 길이의 동영상을 생성할 수 있습니다. 가장 큰 장점은 Kuaishou가 자체 개발한 3D 표현 및 신체 재구성 기술을 사용하여 캐릭터의 전신 사진을 통해 표정과 신체 움직임을 구동한다는 것입니다. 클링 AI는 캐릭터가 노래하고 춤추는 영상, 긴 영상 등의 장면을 생성하는 데 적합합니다.
개요 최근에는 ChatTTS라는 텍스트 음성 변환 모델이 매우 인기를 얻고 있습니다. 게다가 이 모델은 중국의 소규모 팀에 의해 개발되었습니다. 집중하다[…]
GPT-4o의 출시는 더욱 풍부하고 빠른 대화를 통해 하이브리드 입출력 대형 모델의 새로운 이정표를 세웠습니다. 무료로 사용할 수 있고 API 비용이 절감되므로 더 많은 사람들이 이 기술에 접근할 수 있습니다. Gemini1.5 Pro와 비교하여 GPT-4o는 대화 경험이 뛰어나 로봇 및 AIGC 애플리케이션 개발을 촉진합니다. 이러한 발전은 생성 AI 분야의 중요한 발전을 나타내며, 인간과 컴퓨터의 상호 작용 및 콘텐츠 생성과 같은 영역에 새로운 가능성을 가져옵니다.
Sora 및 Stable Video Dissfusion과 같은 비디오 생성 모델은 특히 캐릭터 움직임에서 출력 비디오를 정확하게 제어할 수 없는 문제에 직면하는 경우가 많습니다. 제어 가능한 비디오 모델은 프롬프트 단어를 통해 비디오 속 캐릭터의 동작을 정확하게 제어할 수 있습니다. 실제 물리적 이해 기능을 갖춘 최초의 비디오-3D 모델인 Viggle AI는 캐릭터의 움직임을 자유롭게 제어할 수 있으며 Discord 플랫폼에 내장되어 있습니다. 이러한 제어 가능한 비디오 기술은 디지털 휴먼 제품의 비용을 크게 절감하고 다양한 디지털 휴먼 비디오 제작을 가능하게 합니다.
새롭게 업그레이드된 멀티모달 AI 모델인 Gemini 1.5 Pro를 테스트한 결과 사용자는 텍스트, 사진, 비디오, 파일 및 폴더를 포함한 보다 포괄적인 입력 유형을 지원하지만 추론 능력, 특히 오른쪽과 오른쪽을 구별하는 능력이 크게 향상되지 않았다는 사실을 발견했습니다. 잘못된. 또한, 영상, 파일, 폴더 입력을 처리하는 데 시간이 오래 걸리고, 대용량 데이터를 처리하는데 한계가 있습니다.
Open AI는 2024년 2월 16일 Sora라는 고급 비디오 생성 모델을 출시하여 GPT에 버금가는 관심을 불러일으켰습니다. 아직 공개되지 않은 Sora는 Transformer와 확산 아키텍처를 결합하여 고화질 비디오 시뮬레이션을 구현합니다. TikTok은 다양한 프롬프트의 편집되지 않은 비디오를 통해 Sora의 역량을 선보이며, 급성장하는 비디오 생성 분야에서 Sora의 잠재적인 영향을 미리 보여줍니다.