文章作者、来源:字母AI 融资之后,招人是DeepSeek释放的第一个明确信号。 6月25日,DeepSeek发布了一张大规模招聘海报,表示随着技术演进,他们正努力将所有部门的规模扩大至少一倍。 所有部门,扩大至少一倍。 从研发和算力,到产品、运维和职能体系,DeepSeek正在从一个主攻研究突破的小队,走向一个持续生文章作者、来源:字母AI 融资之后,招人是DeepSeek释放的第一个明确信号。 6月25日,DeepSeek发布了一张大规模招聘海报,表示随着技术演进,他们正努力将所有部门的规模扩大至少一倍。 所有部门,扩大至少一倍。 从研发和算力,到产品、运维和职能体系,DeepSeek正在从一个主攻研究突破的小队,走向一个持续生

大扩军之后,DeepSeek怎么走

2026/06/26 19:37
阅读时长 18 分钟
如需对本内容提供反馈或相关疑问,请通过邮箱 [email protected] 联系我们。

文章作者、来源:字母AI

融资之后,招人是DeepSeek释放的第一个明确信号。

6月25日,DeepSeek发布了一张大规模招聘海报,表示随着技术演进,他们正努力将所有部门的规模扩大至少一倍。

所有部门,扩大至少一倍。

从研发和算力,到产品、运维和职能体系,DeepSeek正在从一个主攻研究突破的小队,走向一个持续生产模型、交付产品、运营组织的平台公司。

海报上写得很浪漫:当今人类正处于AGI的前夜,加入DeepSeek,可以亲历AGI的发展进程,坐在时代前排,见证一个新纪元的诞生。

但浪漫背后是非常具体的现实问题。

以前,当一家公司提到AGI,外界总是会先看研究员、论文、模型架构,看谁离“智能涌现”更近。

然而,“智能涌现”和工程落地之间,还有很长的一段距离。如果AGI想要真正进入现实世界,进入产品和企业,它就一定会变成工程问题、算力问题、产品问题,最后也会变成组织问题。

一家公司想坐在“时代前排”,不能只有写论文和训练模型的人,也要有人把集群跑稳、把推理成本压下来、把产品交到用户手里,把那些看起来不够AGI的交付能力撑起来。

DeepSeek这次扩招,可以看做一次拿到融资之后的组织补课。它要补的,正是AGI下半场所需要的基础设施能力。

融资之后

DeepSeek正在进入一个和早期完全不同的成本结构。

,DeepSeek最新一轮融资规模超过70亿美元,折合人民币超过500亿元。这轮融资的用途包括增强算力能力和改善员工福利。

过去,DeepSeek改写了大模型行业的成本叙事。在OpenAI、Anthropic、Google等海外AI大厂不断堆算力、堆资本、堆数据中心的时候,DeepSeek用更低的训练成本、更高的工程效率和开源策略,证明了前沿模型不一定只能由最有钱的公司做出来。

低成本突破不等于低成本竞争,做出一代强模型和推动工程落地是两件不同的事。前者看研究判断、工程效率和模型训练能力;后者则考验算力供给、系统稳定性、产品交付和组织协同。

DeepSeek此前用相对高的效率证明了自己有能力做出强模型,但到了V4之后,它的位置发生了变化——与华为昇腾等国产AI芯片的适配,不仅是技术上的工程实现,也让DeepSeek变成了国产AI算力生态里的关键应用方。

然而,模型能不能跑在国产算力上只是第一步,真正困难的是在大规模用户和开发者调用中保持可用。

一方面,高端算力容量会直接影响模型服务的成本和吞吐。DeepSeek此前提到,V4-Pro的价格下降与昇腾950超节点的规模出货相关,这意味着DeepSeek的商业化供给不只取决于模型能力本身,也关乎到底层算力能不能持续扩容。

另一方面,V4发布前后,DeepSeek用户侧仍不时出现“服务器繁忙”、响应失败、对话中断等反馈,暴露出了DeepSeek走向平台化必然承受的压力。

到了这个位置,只靠研究和工程小队的突击是走不通的。

融资补的是消耗能力,它让DeepSeek有资本继续进入高强度竞赛。但资本只能解决资源供给的一部分,不能替代组织建设。

对于一家已经拥有大规模用户关注、开发者调用需求和产业链位置的AI公司来说,下一阶段的关键不只是继续训练更强模型,也包括推理服务、系统稳定性、产品化、数据工程和后台职能的同步扩张。

此次扩招,正是DeepSeek走向平台公司的一次组织补全。

DeepSeek此次招聘涉及27类技术和支持岗位,覆盖了一家公司从模型实验室走向平台型组织时必须补齐的整套能力:从全栈开发、算法研发,到AI核心系统、运维、产品、模型数据策略,再到HR、行政、法务、财务等职能体系。

尤其值得注意的是,DeepSeek开始大规模招聘那些看起来“不够AGI”的岗位。

运维不负责定义智能,但负责让服务不中断;产品经理不训练模型,但负责把模型能力变成用户愿意持续使用的产品;数据策略团队不一定写出最漂亮的论文,但决定模型能否在真实反馈中继续迭代;HR、法务、财务、行政不会出现在模型排行榜上,但一家进入高强度竞争的AI公司,不可能永远靠创始人意志和小团队惯性运转。

不过,到了这一步,DeepSeek又将面对下一个问题:

一个靠小队突击跑出来的AI公司,能不能在长大之后,仍然保持原来的速度和锋利?

小队之后

DeepSeek早期的优势,不只是模型能力本身,也包括它背后的组织形态:决策距离短,研究人员和工程人员之间的协作摩擦低,方向判断可以更快传导到模型训练、系统优化和开源发布上。

短链路的组织形态特别适合模型早期的突破阶段,在这个阶段,最重要的不是部门齐全,而是判断够快。

新想法能不能马上试、工程优化能不能立刻进训练流程、模型要不要继续开源、技术路线要不要继续押注……这些问题如果都要经过漫长的管理链条,机会很容易就错过了。

小团队有时能在前沿技术竞赛里打出大公司的效果,关键就在于决策链条够短。反过来说,大公司拥有更多人才、更多算力、更多资金,但这些资源并不会自动转化成速度。

资源要被组织起来,才会变成真正的能力。否则,人才越多,可能只是会议更多;部门越全,可能只是审批更长;安全、产品、商业、品牌、法务都开始介入之后,一个原本应该快速判断的技术问题,就有可能变成一场漫长的组织协调。

Google就是一个值得对照的反例。

Transformer诞生于Google,AlphaGo、AlphaFold、Gemini也都来自Google体系。论研究积累、基础设施和人才厚度,Google几乎是全世界最强的AI公司之一。

但过去几年,Google在生成式AI上的表现也不断提醒外界:人才多并不等同于组织有效。

一家公司可以拥有最好的研究员、最强的基础设施、最多的产品入口,却仍然可能在关键时刻慢半拍。原因并不一定是技术不够,而是技术从实验室走到产品、从产品走到用户、从用户反馈再回到模型迭代,中间要穿过太多组织层级。

这种慢半拍,在AI编程上表现得尤其明显。

Pichai Sundararajan承认了Google在agentic coding上“有点落后”,Google联合创始人Sergey Brin最近也在内部备忘录中要求团队“紧急弥合”AI编程能力上的差距,把模型变成能够产出最终代码的“主力开发者”。

等到Google意识到AI编程已经变成一个独立战场时,Claude Code、Cursor和Codex们已经先一步占住了开发者心智。可以说是非常后知后觉了。

在搜索、广告、云计算或者社交产品里,大公司还可以依靠规模、渠道和既有用户基础慢慢推进。但在大模型竞赛里,模型能力、产品体验、开发者心智和市场预期都在快速变化,窗口期被压缩到了很短的时间里。

决策链越长,方向就越容易被稀释。

就在最近,短短一段时间内,Google连续失去了多名核心AI人才:Transformer论文作者之一、Gemini联合负责人Noam Shazeer去了OpenAI;AlphaFold核心人物、2024年诺贝尔化学奖得主John Jumper去了Anthropic;Gemini核心研究员Jonas Adler和AlphaFold 2/3核心作者Alexander Pritzel,也被曝将转投Anthropic。

未上市AI公司的股权激励是OpenAI、Anthropic吸引顶级人才的重要筹码,但外界讨论这些离职时,提到的不只是薪酬和股权,还包括大公司流程、技术自主权和决策效率。尤其是Noam Shazeer——早在2021年,他就曾因Google的决策链条过长选择离开,后被Google以27亿美元的高价带回。如今,他又一次离开了Google。

更集中的目标、更大的技术自主权、更少的官僚流程,会让研究员觉得自己能更快做出东西。

DeepSeek接下来要避免的,恰是Google暴露出的“大公司病”。

它必须长大,因为平台公司不能只靠小队突击;但它又不能长成一套迟钝的大厂机器,否则早期最宝贵的速度和判断力会被流程吞掉。

二者之间的平衡还需要谨慎把握,如何做到“大而不钝”,是DeepSeek下一阶段必须思考的问题。

平台化之后

模型竞争正在变成系统竞争。

早期,外界衡量一家AI公司的核心标准在于模型的强度,以及它能不能在训练效率、模型架构和开源策略上打出突破。

而现在,模型能力已经不再单独决定一家公司能走多远。算力、工程、产品和交付能力,都会反过来决定模型能不能被真正用起来。

当DeepSeek从实验室走向平台公司,外界对它的衡量标准就会发生变化。

组织能力只是其中的一个方面。高峰期的响应速度、API调用的稳定性、产品功能的一致性、企业客户接入后的可用性,以及国产算力适配之后能否真正带来更低成本的服务,都会成为DeepSeek绕不开的问题。

对免费用户来说,服务器繁忙可能只是一次体验波动;但对付费用户、开发者和未来的企业客户来说,响应失败、对话中断、API限流和功能降级,都会直接影响他们是否愿意把DeepSeek接进真实工作流和业务系统。

平台化之后,模型能力决定用户愿不愿意来,稳定性决定用户敢不敢留下。

DeepSeek过去遇到的那些工程和服务问题,并不会随着模型能力变强而自动消失,相反,随着它进入付费端、开发者生态和企业场景,这些问题将面临更严格的检验。

从国产算力适配、融资,到这次大规模招聘,DeepSeek正在经历走向平台化的关键阶段。

把模型突破变成稳定的平台能力并不容易。它要继续保持研究小队时代的锋利度,又要补上平台公司必须有的交付能力和组织厚度;它要继续做出强模型,也要让强模型真正变成用户、开发者和企业客户可以依赖的服务。

过去,它用一次次模型突破让世界看见了中国AI公司的效率和野心,接下来它要证明的是,这种效率和野心能不能被做成一个长期运转的平台。

我们当然期待DeepSeek越做越好、做大做强。

在大模型竞赛越来越被资本、算力和巨头垄断的今天,DeepSeek曾经证明过,前沿模型的突破不只有一种路径。

现在,它正在走向更复杂、也更真实的下一阶段。

CHZ一周暴涨28%!2022年的暴跌会重演吗?

CHZ一周暴涨28%!2022年的暴跌会重演吗?CHZ一周暴涨28%!2022年的暴跌会重演吗?

上MEXC 0费率多空双向布局,涨跌皆有应对之策!

免责声明: 本网站转载的文章均来源于公开平台,仅供参考。这些文章不代表 MEXC 的观点或意见。所有版权归原作者所有。如果您认为任何转载文章侵犯了第三方权利,请联系 [email protected] 以便将其删除。MEXC 不对转载文章的及时性、准确性或完整性作出任何陈述或保证,并且不对基于此类内容所采取的任何行动或决定承担责任。转载材料仅供参考,不构成任何商业、金融、法律和/或税务决策的建议、认可或依据。

世界杯预测,一单串多场,搏200倍收益!

世界杯预测,一单串多场,搏200倍收益!世界杯预测,一单串多场,搏200倍收益!

MEXC App 6.60.0 全新升级,巴西/法国/阿根廷等最多20场组合,一键轻松下注!