AIGC是什么:一文读懂AIGC
AIGC是什么?
AIGC是英文AI-generated content的缩写,也就是人工智能生成内容。
简单地说,就是通过一些提示词来生成文字内容、图片、视频、动画,甚至是生成代码。
AIGC的原理
AIGC的原理其实很简单,人工智能发展到现在,已经出现了“涌现”能力,AIGC就是利用人工智能的“涌现”能力,通过一些简单的“提示词”来实现让人工智能去想象、推理、分析,最终,“涌现”内容。
AIGC的意义
AIGC将改变整个内容产业。
AIGC大大加强了文字内容、图片内容、视频内容、动漫内容的生产力,提高了内容生产效率。所以,未来,大量优质的内容都将通过人工智能来生产或辅助生产。
AIGC的历史
AIGC,始于2022年。
2022年底,GPT3和ChatGPT的发布,标志着一个新的内容生产时代的来临。AIGC这个概念也在2023年开始流行。
世界各地,大量的AIGC创业团队和个人纷纷开始新一轮的创业热潮。
来自Google的数据,和AIGC相关的搜索量急剧上涨。
AIGC的基础——大语言模型(LLM)
大语言模型(Large Language Model,缩写LLM),简称大模型,是AIGC的基础。人工智能的涌现能力就来源于大语言模型。
到目前为止,根据用途的不同,大模型可以分为以下几类:文本类、图片类、视频类。
1、文本类
这是基本的大模型。主要用来实现对话(chatbot)、文本生成、代码生成等。最有名的有以下几个:
GPT
用于对话和文本内容生成。
由OPenAI打造的大模型,是现在使用最多的大模型。ChatGPT就是基于GPT大模型的。闭源大模型。
PaLM
用于对话和文本内容生成。
由Google打造的大模型,是目前,各方面都和GPT比较接近的大模型。未来是否开源,不确定。
Llama
用于对话和文本内容生成。
由MATE公司打造的大模型。开源大模型。
应该是现在开源的用于对话和文本内容生成的大模型中最好的一个了。
文心
用于对话和文本内容生成。
由百度打造的大模型。是现在对中文支持最好的大模型。闭源。
2、图片类
图片类大模型是用来生成图片的大模型。可以实现文本生成图片(即:text to image),和图片生成图片(即:image to image)。目前,最热门的图片类大模型主要是:
Midjourney
用于图片生成。
由一个小团队打造,是现在最流行的图片生成大模型。闭源。
Stable Diffusion
用于图片生成。
由一个小团队打造。和Midjourney接近。开源。
DALL.3
用于图片生成。
由OpenAI打造。闭源。
3、视频类大模型
视频类大模型是用来生成视频的大模型。主要有三种:
文字生成视频:text to video,通过提示词(文字)直接生成视频。
图片生成视频:image to video,通过图片,或图片+文字生成视频。
视频生成视频:video to video,通过视频,或视频+文字生成视频。
目前,最热门的视频类大模型主要有以下几个:
Stable Video Diffusion
由 stable.ai打造,是现在最热门的视频生成类大模型,开源。
Gen-2
由runway打造。是现在最成熟的视频生成类大模型。闭源。
Gen-2的一大特点就是强调真实感。所以,使用Gen-2生成的视频,往往真实感极强。
AIGC的关键——提示词(prompt)、上下文(context)和AI代理(AI Agent)
1、提示词(prompt)
和大模型的交互方式就是使用提示词(prompt)。
聊天、生成文本、生成图像、生成视频。。。都是用提示词和大模型交互实现的。
生成什么样的内容?内容的质量如何?在大模型一样的前提下,提示词的不同,会让最后的结果千差万别。
所谓的用自然语言和人工智能交互,说的就是提示词。
2、上下文(context)
大模型是可以根据一定长度的上下文来理解提示词的。各个大模型对上下文长度限制也是不同的,一半来说,上下文长度越长,那么,对提示词的理解越接近提出这个提示词的人的想法。
对于AIGC应用来说,有多轮对话模式和单轮对话模式。
多轮对话模式:使用大模型上下文。
单轮对话模式:不使用大模型上下文。
其实,对于很多内容生成的场景,不需要上下文,只要单轮对话模式即可。
3、AI代理(AI Agent)
AI代理,简单地说,就是给大模型定义的一个角色。先给大模型定义一个角色,然后,让这个角色完成你指定的任务。
你或许会奇怪,为什么要这么做?
其实很好理解。就拿让GPT写一个短篇小说来说,写同一个主题,同一个标题的短篇小说,如果你不定义角色,和把GPT分别定义角色为“托尔斯泰”和“JK罗琳”,三种情况的结果对比,差别是很大的。
你可以试一下。
AIGC的应用方向
1、对话类应用(Chatbot)
问答类、AI女友、角色扮演等是现在的对话类应用主要的几个方向。
2、文字内容生成(Text Generate)
小说生成、文章生成、论文生成、营销文案生成等。
文字内容生成是现在AIGC方向上做的最多的应用。
3、图片内容生成(AI Image)
4、视频生成(AI Video)
5、动漫生成(AI Anime)
6、代码生成(AI Code)
AIGC产业格局
1、大模型厂商
AIGC时代的核心,就是大模型,不断提升大模型的能力,将是大模型厂商不断努力的方向。每一个大模型都将形成一个应用生态。大模型厂商的盈利,既可以直接向用户提供直接的应用盈利,也可以向自己的生态中的开发者收取费用。
2、AIGC应用厂商
一方面面向用户的需求,一方面面向大模型的能力。在两方面寻找最合适的应用点、增长点和盈利点。
3、AIGC应用分发厂商
AIGC应用的大量出现,那么,对AIGC应用的分发需求也将越来越多。AIGC应用更多的构建在web上,所以,web的开放性导致分发厂商的大量出现。这一点,更像是PC互联网时代的导航站,而不会像移动互联网时代比较封闭的应用商店。
如何开始你的AIGC业务?
1、如果你想利用AIGC应用提高自己的生产力
你需要一个经常更新的AIGC导航站。或者经常关注Product Hunter网站上AIGC的,因为很多AIGC的应用上线后会第一时间到这个网站上发布,以获得更多关注。
2、如果你想制造AIGC应用
首先,你需要熟悉各个大模型的能力,多玩玩GPT等各个大模型吧。
然后,你需要找到一个好的应用场景和应用点。
做好这两点,做一个AIGC应用,就是一个很简单的事情。