AI只有Chat?——AIGC产品进化论
从2022年年底到现在,接近两年的时间,AIGC产品从无到有,从简单的Chatbot套壳和单次generate,发展到现在,不仅应用到了各种应用场景和领域,而且产品形态也有了很多的发展。
本文从用户需求的发展来聊聊AIGC产品形态的发展。
AI从Chat开始
自从ChatGPT爆火,很多套壳GPT接口的通用chatbot出现了,因为信息差、网络、价格、OpenAI的限制等等各种原因,这些chatbot,靠着SEO快速获取流量并赚到了钱。
而且,时至今日,这些chatbot依然活的很不错,毕竟AIGC时代,对chatbot的需求,仅仅一两个ChatGPT这样的巨头是远远不够的。
Generator大爆发
然而,通用的chatbot是远远无法满足具体场景的需求的。而且,从ChatGPT的爆火开始,各种Generator的需求出现井喷式的增长,包括文字、图片、视频、音乐等等。于是,各种简单的单次生成的Generator开始大爆发,从去年一直到现在,势头只增不减。
两种基于单论对话的Generator
总结下来,这种基于单轮对话的Generator有两种。
第一种,是基于单个大模型的单轮对话生成结果。
比如,比较常见的文字生成、图片生成等。
第二种,是基于多个大模型的单轮对话生成结果。
就是说,基于一次prompt的提交,多个大模型生成不同的结果,最后组合数据,返回给用户。
最典型的就是音乐的生成,像Suno,提交一段prompt,它不仅会生成音乐,也会生成这个音乐的封面图、标题和歌词。而且,这其中是有流程的。先生成标题和歌词,然后再生成音乐。
基于单论对话的Generator大爆发的原因
其实,基于单轮对话的Generator,以及基于单轮对话的AI Search和AI Answer的大爆发有两方面的原因。
一方面,是用户各种用户场景对AI的需求井喷式增长
但这些需求相对比较简单,只要能简单地生成比较满意的结果就可以。因为只要能做到这一点,就能比以前的方式大幅度地提升效率和提升质量。
比如,写一封邮件,以前需要花上一些时间,思考一下,一句句写出来,但有个AI Email Generator,只要提要求,就能得到一个基本满意的结果,然后,自己稍微改一下就可以了。
另一方面,是开发成本的问题
对于做AI产品的站长和开发者来说,这种单轮对话的generator开发简单,没有多大的开发成本,可以快速做出来,上线,然后通过SEO获得大量的流量,并且变现。
AI回归Chat
然而,今年以来,有一个明显的变化。
针对特定场景和需求的、基于Chat,也就是基于多轮对话的Generator开始强势登场。相对于基于单轮对话的Generator,它的优势非常明显。
基于单轮对话的Generator是有问题的。
做过这种基于单轮对话的Generator的朋友们感受应该会比较明显,用户对这种产品的使用方式是用同一个prompt多次Generate,得到多个结果,然后,如果有满意的,那就结束,如果没有满意的,要么修改prompt再次尝试,要么就放弃了。
无论是文字的生成还是图片、音乐、视频等的生成,都是这样。
如果没有做过这种基于单轮对话的Generator,可以去discord上的midjourney服务器,看一下就知道了。
原因其实也简单,用户使用这种基于特定场景和需求的Generator,目标就是能简单地获得自己想要的结果。
然而,基于单轮对话的Generator,每次生成,其实得到的都是不确定的结果,这个结果,用户可能满意,但更多时候是不满意,所以,用户就只能多次尝试,甚至稍微该动prompt,之后多次尝试,以期得到一个满意的结果。也就是说,这种产品无法给用户一个获得确定的满意的结果的方式。
但,基于Chat(多轮对话)的Generator就不一样了,用户第一次生成后,如果不满意(绝大多数情况下是不满意),可以让AI在这个基础上修改,甚至是多次修改,直到得到一个满意的结果。
也就是说,基于Chat的Generator给了用户一种获得确定的满意的结果的方式。
比如,V0这个产品,基于Chat,生成代码,把代码版本管理加入进来,每一次Chat和修改,就会在原有的代码基础上,生成一个新的版本。
再比如,交互式故事生成器,每一次Generate,生成这个故事的一个段落,然后用户再continue或通过prompt控制情节的发展生成下一个段落。
这些都是基于单轮对话所无法达到的,但却是用户能得到自己想要的确定的结果的方式。
AI只有Chat?
需求是递进的
لخص
AIGC时代,我们要如何工作和创作?这是所有AIGC产品都将面临的问题。
推荐大家去看《西部世界》这个美剧。
2018年,我做了一个机器人,而那一年,正是《西部世界》第一季火爆的时候,说实话,这部美剧对我做那个机器人启发很大。
去年(2023),《西部世界》第四季播出,我看了之后,对一个场景印象特别深刻。
女主在公司,创作一个游戏的场景,她对AI描述了一下大致的情况,然后AI直接渲染出了3D的人物和场景。然后,女主又多次告诉AI如何修改,甚至是否定AI的创作。
这不就是AIGC产品的终极交互方式吗?至少也是终极交互方式之一啊。