2024年02月热点:Sora——Open AI的视频生成大模型
2024年02月16日,Open AI发布了视频生成大模型,随后,sora这个词在Google的搜索量开始快速上升,一度几乎赶上gpt的搜索量,不过最近几天下降了一些。
在经历了2023年的文字生成、图像生成的热点后,2024年,视频生成将成为一个很大的热点。sora的推出,无疑是开启了这个大热点。
Sora是什么?
Sora就是Open AI的文生视频大模型,目前还没有开放使用。
Sora有什么优势?
Sora是目前所有的视频生成模型中最先进的,它的目标不是仅仅生成视频,而是对现实世界的模拟。
Sora采用Transformer和扩散模型两种架构,相对其它视频模型单纯采用扩散模型要更为先进,生成的视频的逼真度更高。
如何使用Sora?
目前Sora还没有正式开放使用,正式开放使用后,可在openai官网使用,也可通过调用openai的sora的接口调用。
Sora生成的视频
可参考openai在tiktok的页面。
这个视频是用Sora生成了5段视频,没有做任何修改,拼成了一个视频。
These videos were generated by our text-to-video model, Sora, without modification.
Prompt 1: a scuba diver discovers a hidden futuristic shipwreck, with cybernetic marine life and advanced alien technology
Prompt 2: a man BASE jumping over tropical hawaii waters. His pet macaw flies alongside him
Prompt 3: Close-up of a majestic white dragon with pearlescent, silver-edged scales, icy blue eyes, elegant ivory horns, and misty breath. Focus on detailed facial features and textured scales, set against a softly blurred background
Prompt 4: a red panda and a toucan are best friends taking a stroll through santorini during the blue hour
Prompt 5: a dark neon rainforest aglow with fantastical fauna and animals
总结
视频生成是一个巨大的需求,Sora是目前视频生成最先进的大模型。2024年,视频生成这个领域一定会非常火爆。