Logga in

o3-mini VS DeepSeek r1:血拼,OpenAI的绝地反击

Författare:neo yang Tid:2025/02/02 Läsa: 2046
OpenAI o3-mini上线了。免费版ChatGPT可用。 面对DeepSeek的汹涌浪潮,OpenAI紧 […]

OpenAI o3-mini上线了。免费版ChatGPT可用。

面对DeepSeek的汹涌浪潮,OpenAI紧急上线了o3-mini这个号称OpenAI推理系列模型中“最新、最具成本效益的模型”。

参考OpenAI官方的o3-mini的介绍:https://openai.com/index/openai-o3-mini/

虽然o3-mini刚刚出来,但网上已经有很多文章在对比o3-mini和DeepSeek r1的各种参数了。有兴趣可以去搜一下。

我今天不对比参数,而是用实际工作中需求,来实际测试一下这两个模型。

就还用之前做的Wordpress插件的提示词。

昨天的文章中就用这个提示词对比了DeepSeek r1和ChatGPT(实际用的是GPT-4o),今天,我们还用这个提示词,让o3-mini也写这个Wordpress插件。

一、生成的结果

1、o3-mini的结果

我分享了这个链接:https://chatgpt.com/share/679f3977-bb38-800f-8d8d-4b3696fb6e1e

推理:

o3-mini的结果,有个新东西:

Reasoned for a couple of seconds

o3-mini推理了几秒钟,说实话,这个过程真的很快,几乎是闪过去的。

点击它可以在右侧打开,看到它的推理。

看到它的推理过程,我愣了好几秒。这不就是加了两句提示词吗?

我觉得,可能是我弄错了,o3-mini可能不会显示它的推理过程。或是因为刚上线,有些BUG之类的。。。

请相信OpenAI,好歹是个AI巨头,不至于忽悠咱们。

不至于。

咱过几天再测。

项目结构

2、DeepSeek r1的结果

推理

项目结构

二、结果对比分析

1、推理过程

不用说了,DeepSeek完胜。

DeepSeek是全面地分析了需求和场景,考虑到了这个插件在实际应用中的各种细节和情况。尤其是提示词中并没有提到的setting page,它在分析后也加入到项目中,这一点,惊艳到我了。

o3-mini的推理,就不说了。

推理和结论的不同直接决定了后边整个项目的结构和代码的不同。

2、项目结构

DeepSeek r1生成的结果,项目结构非常完整。

o3-mini生成的结果,其实也是可以的。只是,因为之前的推理结果的原因,没有setting page。所以DeepSeek r1胜出。

3、代码

代码本身倒没什么可对比的,两者的差异,其实都是前边的推理结论不同和项目结构不同才造成了代码的不同。

三、总结

抛开大模型参数的对比,从实际应用来看,至少,这次测试,还是DeepSeek明显有优势。

taggar: ,

关注我的微信公众号



copyright © www.lyustu.com alla rättigheter reserverade.
Tema: TheMoon V3.0 Författare:neo yang