o3-mini VS DeepSeek r1:血拼,OpenAI的绝地反击
OpenAI o3-mini上线了。免费版ChatGPT可用。
面对DeepSeek的汹涌浪潮,OpenAI紧急上线了o3-mini这个号称OpenAI推理系列模型中“最新、最具成本效益的模型”。
参考OpenAI官方的o3-mini的介绍:https://openai.com/index/openai-o3-mini/
虽然o3-mini刚刚出来,但网上已经有很多文章在对比o3-mini和DeepSeek r1的各种参数了。有兴趣可以去搜一下。
我今天不对比参数,而是用实际工作中需求,来实际测试一下这两个模型。
就还用之前做的Wordpress插件的提示词。
昨天的文章中就用这个提示词对比了DeepSeek r1和ChatGPT(实际用的是GPT-4o),今天,我们还用这个提示词,让o3-mini也写这个Wordpress插件。
一、生成的结果
1、o3-mini的结果
我分享了这个链接:https://chatgpt.com/share/679f3977-bb38-800f-8d8d-4b3696fb6e1e
推理:
o3-mini的结果,有个新东西:
Reasoned for a couple of seconds
o3-mini推理了几秒钟,说实话,这个过程真的很快,几乎是闪过去的。
点击它可以在右侧打开,看到它的推理。
看到它的推理过程,我愣了好几秒。这不就是加了两句提示词吗?
我觉得,可能是我弄错了,o3-mini可能不会显示它的推理过程。或是因为刚上线,有些BUG之类的。。。
请相信OpenAI,好歹是个AI巨头,不至于忽悠咱们。
不至于。
咱过几天再测。
项目结构
2、DeepSeek r1的结果
推理
项目结构
二、结果对比分析
1、推理过程
不用说了,DeepSeek完胜。
DeepSeek是全面地分析了需求和场景,考虑到了这个插件在实际应用中的各种细节和情况。尤其是提示词中并没有提到的setting page,它在分析后也加入到项目中,这一点,惊艳到我了。
o3-mini的推理,就不说了。
推理和结论的不同直接决定了后边整个项目的结构和代码的不同。
2、项目结构
DeepSeek r1生成的结果,项目结构非常完整。
o3-mini生成的结果,其实也是可以的。只是,因为之前的推理结果的原因,没有setting page。所以DeepSeek r1胜出。
3、代码
代码本身倒没什么可对比的,两者的差异,其实都是前边的推理结论不同和项目结构不同才造成了代码的不同。
三、总结
抛开大模型参数的对比,从实际应用来看,至少,这次测试,还是DeepSeek明显有优势。
关注我的微信公众号