大模型和AI芯片联合突围的中国叙事

转自:中国经营网

文 李玉洋

2025年年初,中国AI大模型初创公司深度求索因发布开源推理大模型DeepSeek-R1而在全世界一鸣惊人,犹如一颗深水炸弹,打破了由OpenAI、Anthropic、谷歌等国外豪门所把持的全球顶级大模型俱乐部的平静。此后的一整年,DeepSeek的每一个动作,都成为全球大模型市场的焦点。

不过,对于中国大模型生态圈而言,深度求索的“鲇鱼效应”更体现在其让FP8(8位浮点数)这种低精度格式获得全行业认可,一方面搅动了顶级大模型俱乐部的世界格局,另一方面也力挺了国内AI芯片的发展。

“2025年国内AI芯片行业呈政策驱动、需求爆发、国产替代深化的态势,市场规模与国产化率双升。”复盘2025年,刚刚在香港联合交易所通过聆讯的国内GPU厂商天数智芯相关人士对《中国经营报》记者如此表示。

需要指出的是,2025年不断更新的国内大模型成为国产AI芯片发展的一股助力,尤其是开源模型。“以DeepSeek为代表的国产大模型的优秀表现加快了AI技术在行业的落地速度和广度,在算力国产化大背景下,国内GPU厂商的市场空间被极大拓展。”2025年12月5日已在科创板正式上市的摩尔线程(688795.SH)方面对记者表示,“2025年国内大模型的发展对国产AI芯片行业来说是强催化剂,影响显著且持续。”

天数智芯上述人士也有类似感受:“在生态端,模型厂商与芯片企业联合优化成常态,开源模型降低适配门槛,加速‘芯片—模型—应用’闭环生态形成。”

诚然,虽然国内AI芯片企业与国际龙头之间仍有差距,但回望国产AI芯片叙事脉络,2025年一定会是个重要节点,因为这一年国产GPU行业已经迈入商业化与规模化的关键时期。

降低算力需求 通过软件提升效能

芯片,是AI所需算力的硬件基础,而开源模型使得AI的部署和使用成本大大降低。在AI推理方面,国内各类AI芯片百花齐放。

据不完全统计,包括华为昇腾、昆仑芯、海光信息、沐曦股份(688802.SH)、摩尔线程、天数智芯等多家AI芯片厂商相继宣布了对DeepSeek模型的快速部署和训练,使得国产AI芯片能够在推理任务中与英伟达GPU竞争,甚至在某些场景中表现更好。

“DeepSeek的成功表明,通过模型压缩、稀疏计算、混合精度训练等技术手段降低算力需求,可以在一定程度上弥补硬件性能不足。”摩尔线程方面表示,这为国内芯片提供了软硬件协同设计的新思路,“证明了在硬件性能短期内难以赶超的情况下,通过软件层面的创新仍可提升整体计算效能”。

同时,深度求索还触发了下一代AI芯片的“底层代码”——FP8低精度格式,该格式对计算精度要求相对较低,一定程度上降低了对晶体管密度的依赖,意味着不再那么迫切需求世界上最先进的芯片制造工艺。

而深度求索在成功训练出世界首个使用FP8精度的开源大模型DeepSeek-V3后,又在DeepSeek-V3.1中使用了UE8M0 FP8 Scale的参数精度。

摩尔线程方面指出,DeepSeek在混合精度训练方面的成功,展示了低精度计算在AI训练中的潜力,“国内芯片厂商可以借鉴这种模式,优化芯片的计算单元,支持更灵活的精度配置”。

根据公开资料整理,截至2025年12月,国内已有包括摩尔线程、燧原科技、沐曦股份、壁仞科技、天数智芯、砺算科技、海光信息(688041.SH)、寒武纪(688256.SH)、中昊芯英、芯原股份(688521.SH)、昆仑芯等10余家厂商推出支持FP8精度的AI 芯片,其中摩尔线程、燧原科技、沐曦股份、寒武纪处于领先地位,均已实现原生FP8支持并完成与DeepSeek这些主流大模型的适配。

专注于推理应用 平替4090没问题

随着国产FP8标准的推广,国产AI芯片在大模型部署方面正逐步缩小与英伟达的差距。

“需求端,基座大模型与行业定制化模型催生高端训推芯片及高性价比推理芯片需求,扩大国产芯片替代空间。技术端,UE8M0 FP8量化这些模型创新倒逼芯片适配,推动硬件架构与算子库升级。”天数智芯方面表示。

“2025年,我们一直在加紧对国产AI芯片的配合和小规模测试。这一过程中最直观的感受是,国产AI芯片的迭代速度在不断攀升,无论是适配性、兼容性还是稳定性,都有明显的提升。我们发现,目前很多过去常用的国外通用芯片的型号,已经完全能用国产GPU进行平替。”国内一家音乐大模型初创公司表示。

该公司还表示,经过相关测试,在推理上,国产GPU平替英伟达4090是没问题的。同时,在政策支持下,使用国内AI芯片的成本也有一定优势。

根据摩根士丹利2025年12月在亚洲市场的实地调研,中国AI加速器市场正出现新的路径分化。部分中国本土AI芯片设计公司开始主动调整技术路线,通过开发相对中端规格的产品,以专注于推理应用。

该调研还指出,中国AI计算的侧重点正在从训练端加速向推理端迁移。

而内存供应链信息同样印证了推理需求的兴起。摩根士丹利指出,新一代国产AI推理芯片正加速采用LPDDR作为主要配套存储方案,以替代供应紧张且成本高昂的HBM。

如何从“可用”到“好用”

知名股权研究机构Bernstein Research在2025年12月发布的一份报告中预测,华为与英伟达在中国AI芯片市场各占40%份额,形成双雄并立格局。到2026年,华为份额将进一步上涨至50%,英伟达萎缩至8%,而寒武纪将取得9%的市场份额。

值得注意的是,2025年8月底,作为A股较为稀缺的AI芯片标的,寒武纪股价一度最高达1595.88元/股,一举超过贵州茅台,成为A股股价最高的个股。

而GPU作为AI芯片的主要技术路线,国内GPU行业在2025年12月迎来上市热潮:12月5日,摩尔线程科创板上市,创2025年科创板募资规模最大的IPO(募资规模约80 亿元);12月17日,沐曦股份登陆科创板,首日股价涨幅692.95%,单签盈利36.26万元刷新A股打新纪录。

除科创板外,港交所则成为国产GPU厂商抢滩资本市场的另一个选择。近期,壁仞科技、天数智芯都通过港交所上市聆讯,“港股GPU第一股”也就要呼之欲出。

然而,这些体现的是国产GPU行业在资本层面的繁荣。业界多认为,2025年国产AI芯片已实现“可用”,但性能、能效仍落后国际竞品。

“如果要说(国产AI芯片)还有哪部分有所欠缺,目前比较明确的需求是希望有更大显存的版本,来满足我们模型训练的需求。”前述国内音乐大模型初创公司表示。

那么,国产AI芯片从“可用”到“好用”的关键突破点是什么?

对此,摩尔线程方面表示,接下来的市场竞争焦点正从“能用”全面转向“好用”,决胜于综合产品力与生态生命力。

首先在产品层面,竞争超越了单纯的算力指标,进入了“综合效率”的比拼。“客户不仅要求高算力,更追求极致的能效比、更高的算力利用率、更优的软件开发体验,其根本目的是降低总体拥有成本(TCO)并获取明确的投资回报。因此,提供高性价比的全栈解决方案,而非单一硬件,将成为关键。”摩尔线程方面表示。

其次在生态层面,挑战更为根本。“在算力供应快速向国产化转移的过程中,国产GPU面临两大考验:一是能否无缝兼容现有的主流软件与开发习惯,确保平滑迁移,这是入场的基础;二是在此之上,能否展现出持续的自主创新能力,通过提供独特的价值吸引开发者,从‘生态兼容者’逐步成长为‘生态定义者’。这要求厂商必须具备强大的战略定力,坚持长期主义,持续投入资源耐心打磨生态,做难而正确的事。”摩尔线程方面如此指出。

还是在2025年12月,美国政府已批准英伟达向中国出售H200芯片,在国内的AI算力生态中激起涟漪。近日还有市场消息称,英伟达已告知中国客户,计划于2026年2月中旬向他们交付H200。

面对英伟达仍占据全球超70%的市场份额,且在高端训练芯片领域仍无替代方案的现状,2026年若海外高端芯片供应变化,国产AI芯片的“换道超车”是继续在推理端深耕,还是必须在训练端实现技术突破?

对此,天数智芯表示,2026 年国产AI芯片“换道超车”,推理端要聚焦爆发场景,推出高性价比、低功耗芯片,构建“芯片—模型—解决方案”生态闭环;训练端则需渐进式突破,先攻克中大规模训练,再联合模型厂商优化框架,同时加速核心IP自主与供应链自主。

“关键在于平衡短期市场份额与长期竞争力,推理端是快速扩大份额的主阵地,训练端是构建核心竞争力的关键,二者并行不可或缺。”天数智芯表示。

上一篇:即时零售大会战:谁失血 谁生长?
下一篇:火爆!外国游客涌入,疯狂“扫货”!直呼“太划算了”
免责声明:

1、本网站所展示的内容均转载自网络其他平台,主要用于个人学习、研究或者信息传播的目的;所提供的信息仅供参考,并不意味着本站赞同其观点或其内容的真实性已得到证实;阅读者务请自行核实信息的真实性,风险自负。