ChatGPT VS DeepSeek:差距是整整一个时代
DeepSeek横空出世的这几天,美国股市暴跌、AI巨头个个恐慌、各种对DeepSeek的调查、污蔑等等层出不穷。
你不觉得奇怪吗?
Google的Gemini出来的时候,也没这么大动静啊。
Meta的Llama也没掀起什么风浪啊。
至于,Claude,似乎一直都静悄悄的。甚至,到现在,很多人都没听说过它。
为什么DeepSeek如此惊天动地?以至于直接引发一场黑客大战。
仅仅是因为DeepSeek是中国的公司搞出来的吗?
仅仅是因为DeepSeek开源,让所有人都能拥有GPT的能力吗?
仅仅是因为DeepSeek所消耗的成本很低吗?
一、你会玩电梯吗?
问个问题,你去公司上班,你在一楼,要乘坐电梯到五楼,而现在,电梯在三楼,那么你要按向上的按钮还是向下的按钮?
或许你会说,那还用问吗?当然是向上的按钮。
没错,我们要按向上的按钮,告诉电梯:我在一楼,要上楼。
但是,如果这部电梯是GPT,不好意思,正确的做法是,你需要按向下的按钮,告诉它:你下来,到一楼。
如果说GPT是这种“不正常”的电梯,那么DeepSeek就是一个正常的电梯了。
对于DeepSeek这样正常的电梯,你需要告诉它,你的需求和场景,然后,它会根据情况去解决问题。
而对于GPT这样“不正常”的电梯,你需要告诉它具体的命令是什么,然后,它去执行。
也就是说,GPT,更多的时候,只是在执行你的命令,你需要告诉它,让它具体做什么,也就是Prompt(提示词)。当你问它一个问题的时候,它其实也只是在执行“回答这个问题”的命令。所以,完全相同的需求,不同的提示词,会得到很不一样的结果。
就连AI Agent也不过是让GPT去扮演一个具体的角色,然后执行命令。
而DeepSeek是在根据你的需求和场景给你解决方案。你需要告诉它你的需求、场景、问题,然后,它会进行一系列的推理分析,最后给出一个系统性的解决方案。
二、实际应用
昨天,我用同样的提示词,让ChatGPT和DeepSeek分别开发了一个Wordpress插件。
这个提示词,我只是大致说明了需求是什么,并没有刻意去优化提示词。
应该说,这是一个稍微有些复杂的插件。
最终得到的结果:
1、ChatGPT
最终得到的只是关键性的代码。并不是一个完整的插件。
2、DeepSeek
通过30秒的思考,最终给出了插件项目的目录结构和各个文件的代码。
也就是说,它给了一个完整的插件。非常完整。
尽管实际测试中依然有bug。
我仔细看了它30秒的思考过程。
首先,它对需求的理解,我觉得是没有问题的。对功能的分析和如何实现这个功能分析得也很仔细,甚至考虑了安全性、系统的性能、需求中没有提到的却很必要的配置页面、错误处理、防止重复点击、图片的预览等等一系列的细节。
很多细节,我都没想到。
如果说,让ChatGPT也做到生成一个完整的插件项目,其实也是可以的,我以前就曾用ChatGPT生成过一些完整的小的项目(只能是很小的项目,或是一个项目的一部分)。但是,你需要写很详细的提示词,也就是说你要给它具体的生成整个项目的命令,它才能帮你生成。或是进行多轮对话,不断地让它增加和修改。
也可以说,ChatGPT,基本上只能做到你想到的,做不到你想不到的。
三、人与机器的交互
技术的发展,往往会搞出各种各样的机器,无论它是智能的还是机械的。而我们与这些机器的交互,一开始,往往都是控制和命令,但随着技术越来越成熟,用户体验越来越好,你会发现,我们与它们的交互中,我们只需要提需求即可。
最老式的电梯,其实只是简单地控制升降,而现代的电梯,实际上,是我们在给它提需求。无论是在电梯外,还是在电梯内。
就连汽车发展了百余年之后,不也开始实现了无人驾驶吗?从控制它的行驶,变成了,给它提需求:来这里接我,去某个地方。
从“你要如何”到“我要如何”,差了整整一个时代。
再加上开源和低成本,现在,谁都可以搞出个不比GPT差的大模型,如果再稍微多花点钱,还不知道会训练出个什么东西。
奥特曼能不慌吗?美国能不慌吗?
四、总结
一直到过年前,我都在天天用ChatGPT,根本离不开。这几天试着用了DeepSeek之后,再也用不回ChatGPT 了。如果非要总结一下,应该是这样的:
你要是奥特曼,你也慌。
关注我的微信公众号