コピーライター、ウェブマスター、プロダクトマネージャー、アーキテクト、独立系開発者。
自从去年开始,大模型,尤其是Claude的不断成熟,AI Code类产品开始不断地成熟。 尤其是Cursor的出现,更是一下子引爆了这个方向。 近期,先是擅长写代码的Gemini 2.0 flash发布,然后,Claud […]
3FS https://github.com/deepseek-ai/3FS 3FS(Fire-Flyer File System)是一个专为AI时代设计的“超级数据管家”。简单来说,它解决了AI训练和推理中大规模数据处 […]
DualPipe https://github.com/deepseek-ai/DualPipe DualPipe是一种双向管道并行算法,专为大规模AI模型训练设计。它通过在训练过程中实现前向和后向计算与通信阶段的完全重 […]
DeepGEMM是什么? DeepGEMM是一个高效通用矩阵乘法(GEMM)库,专为FP8(8位浮点数)精度设计。 DeepGEMM是DeepSeek V3和R1模型训练与推理的关键组件,DeepGEMM不仅支持传统的密 […]
DeepEP是什么? DeepEP 是由 DeepSeek 开发的一个开源通信库,专门为混合专家模型(Mixture-of-Experts,简称 MoE)和专家并行(Expert Parallelism,简称 EP)设计 […]
今天是DeepSeek开源周的第一天,它开源了FlashMLA。 FlashMLA是什么? FlashMLA 是一种专为 NVIDIA Hopper GPU 架构设计的解码内核,旨在优化变长序列的处理效率。 FlashM […]
这两天,Google的Veo 2悄悄地出来了。今天,我简单地测试了一下。 怎么样?有没有点偶像剧的感觉。可惜,只能生成5秒,要不然,短剧演员就该直接失业了。 不过,按目前的情况发展下去,应该用不了多久,就可以直接生成一集 […]
Grok3用过了吗? 这两天,Grok 3的火爆程度,堪比春节期间的DeepSeek啊。 而,实际用过之后,你会发现,Grok 3完全可以取代ChatGPT。 而且,Grok 3还免费,虽然它现在也推出了收费的Super […]
两周前,Figure和OpenAI分手,号称要用自己的大模型。大家纷纷猜测,会不会是DeepSeek,但,我们小看Figure了。 Figure发布了它的通用类人生物控制的视觉-语言-行动模型——Helix。 什么是He […]
今天,微软发布了它的量子计算芯片——Majorana 1 。 不得不说,这是个划时代的产品,不亚于两年前ChatGPT的发布。 DeepSeek频频宕机,英伟达的GPU一卡难求,算力,成了AI大规模应用的一大障碍。 基于 […]