コピーライター、ウェブマスター、プロダクトマネージャー、アーキテクト、独立系開発者。
今天上了个新站。 自从Claude 3.7出来后,这是第一次上站。之前一直用ChatGPT生成页面文案,然后再把文案一部分一部分喂给Claude或是V0,生成页面代码。(因为这样效果最好) 但是,今天发现,有了Claud […]
自从去年开始,大模型,尤其是Claude的不断成熟,AI Code类产品开始不断地成熟。 尤其是Cursor的出现,更是一下子引爆了这个方向。 近期,先是擅长写代码的Gemini 2.0 flash发布,然后,Claud […]
3FS https://github.com/deepseek-ai/3FS 3FS(Fire-Flyer File System)是一个专为AI时代设计的“超级数据管家”。简单来说,它解决了AI训练和推理中大规模数据处 […]
DualPipe https://github.com/deepseek-ai/DualPipe DualPipe是一种双向管道并行算法,专为大规模AI模型训练设计。它通过在训练过程中实现前向和后向计算与通信阶段的完全重 […]
DeepGEMM是什么? DeepGEMM是一个高效通用矩阵乘法(GEMM)库,专为FP8(8位浮点数)精度设计。 DeepGEMM是DeepSeek V3和R1模型训练与推理的关键组件,DeepGEMM不仅支持传统的密 […]
DeepEP是什么? DeepEP 是由 DeepSeek 开发的一个开源通信库,专门为混合专家模型(Mixture-of-Experts,简称 MoE)和专家并行(Expert Parallelism,简称 EP)设计 […]
今天是DeepSeek开源周的第一天,它开源了FlashMLA。 FlashMLA是什么? FlashMLA 是一种专为 NVIDIA Hopper GPU 架构设计的解码内核,旨在优化变长序列的处理效率。 FlashM […]
这两天,Google的Veo 2悄悄地出来了。今天,我简单地测试了一下。 怎么样?有没有点偶像剧的感觉。可惜,只能生成5秒,要不然,短剧演员就该直接失业了。 不过,按目前的情况发展下去,应该用不了多久,就可以直接生成一集 […]
Grok3用过了吗? 这两天,Grok 3的火爆程度,堪比春节期间的DeepSeek啊。 而,实际用过之后,你会发现,Grok 3完全可以取代ChatGPT。 而且,Grok 3还免费,虽然它现在也推出了收费的Super […]
两周前,Figure和OpenAI分手,号称要用自己的大模型。大家纷纷猜测,会不会是DeepSeek,但,我们小看Figure了。 Figure发布了它的通用类人生物控制的视觉-语言-行动模型——Helix。 什么是He […]