压力给到梁文锋

访客 2025-04-17 12:59:57 84271

默认

摘要： 这两天，中美大模型公司各有大事发生。4月15日凌晨，OpenAI发布了GPT-4.1系列模型，包括GPT-4.1、GPT...

这两天，中美大模型公司各有大事发生。

4月15日凌晨，OpenAI发布了GPT-4.1系列模型，包括GPT-4.1、GPT-4.1 Mini、GPT-4.1 Nano，它们的核心特征是成本更低，速度更快；同一天，另一家中国明星AI公司，智谱AI正式启动上市辅导备案，由中金公司担任辅导机构。备案报告显示，智谱AI将在今年8月至10月完成IPO辅导计划。

此前的3月底，智谱AI CEO张鹏曾告诉《中国企业家》，他判断实现AGI，路程还长，“不管我们融了多少钱，其实都是AGI道路上的盘缠，未来，还需要更多盘缠，我们会持续地做相关的事情”。

如今看来，这个“更多的盘缠”就是指IPO。

2025年开年，DeepSeek“燃爆”AI圈，目前，截至R1模型正式发布已经过去86天。

DeepSeek和梁文锋的团队什么时候推出新的大模型产品，尤其是R1的更新版？

《中国企业家》统计了国外Anthropic、Meta等公司更新大模型的周期，如果是模型的重大升级，周期在5至10个月左右；而同一版本的功能升级则在3至4个月之间。

根据DeepSeek官网数据，梁文锋的AI团队更新产品与国外主流公司同频，2024年9月发布V2.5，12月发布V3，2025年3月将V3更新为V3-0324版本，也几乎每隔3个月就会迎来一次升级。

有一些预测认为，DeepSeek下一次更新R1模型可能是在5月初，届时或提前发布，但DeepSeek方面目前还尚未对这种预测进行回应。

OpenAI也在追求更小更快

公开资料显示，GPT-3的参数规模为1750亿，GPT-4的参数规模为1.76万亿，到了GPT-4o参数约2000亿规模，此次OpenAI推出的GPT-4.1 Mini，被称作OpenAI的高效小型模型，在多个基准测试中表现超越GPT-4o，大幅减少延迟并降低83%成本。

GPT-4.1 Nano被称之为首个超小型模型，它能支持100万token的上下文窗口，适用于低延迟任务，如分类和自动补全。

值得注意的是，上述三个模型将上下文窗口处理的规模从GPT-4o的128K直接提升至100万token（1M）。这意味着模型在更长的文本中保持专注和理解的能力得到了强化。

具体到成本、价格方面，GPT‑4.1比GPT‑4o便宜26%，输入、输出分别是每百万token2美元和8美元；GPT‑4.1 Nano输入、输出分别为0.1美元和0.4美元。

对比DeepSeek，标准时间段内，V3模型输入、输出百万token的费用为0.5元、8元，R1推理的费用分别为1元和16元。

可以说，OpenAI也打上了token的价格战，价格直接对标DeepSeek。

与此同时，OpenAI已暂停了其此前2月发布的GPT-4.5，原因在于成本太高，其API定价为输入、输出每百万token75美元、150美元。官方回应说此次调整旨在将更多资源投入未来模型的研发。

关于开源，OpenAI的CEO山姆·阿尔特曼不得不走向与DeepSeek同样的路径，他曾表示，DeepSeek的出现并未影响GPT的增长，OpenAI将推出更好的开源模型。

不过，在DeepSeek冲击之下，阿尔特曼曾经一度非常恼火，甚至恐慌，他曾在社交平台上指责R1模型使用了GPT的数据蒸馏，又写公开信给美国政府，声称限制AI技术流向中国等国家，并禁用DeepSeek。

近期英伟达公开表示，美国政府正在限制其H20芯片向中国的出口，并且H20芯片对华出口需要获得许可证，这一要求是“无限期”。

而H20芯片正是梁文锋最在意的“基础设施”，早先，梁文锋在接受媒体采访时说，“我们真正的挑战从来不是资金，而是高端芯片的出口禁令。”

不过，面对禁令，梁文锋也并非坐以待毙，他曾在接受媒体采访时说，“英伟达的GPU没有什么神秘之处，但要赶上他们，就必须重建团队、付出时间和成本，追赶下一代技术——这才是真正的护城河。”

标签：模型美元

海报

阅读

OpenAI也在追求更小更快

相关推荐

美年大健康郭美玲：做企业即做人｜商界木兰

一个外来妹，如何成为万亿商旅赛道“破壁者”｜商界木兰

长城汽车总裁穆峰：过去十年，全球汽车产业发生了一次“基因突变”

字节重开游戏局

傅斌星：接班“电视剧之王”这三年｜商界木兰

酷特智能董事长：父亲这样培养我接班｜商界木兰

鄂尔多斯王臻：走得稳，是女性创业的优势｜商界木兰

国内最早的AI大模型公司已经开始亏损了