在人工智能产业蓬勃发展的当下,算力作为其核心驱动力,重要性不言而喻。然而,国产算力在前进的道路上却面临着诸多阻碍,发展现状不容乐观。
从硬件基础来看,制程代差成为国产算力芯片难以忽视的痛点。太极股份数字基础设施业务集团总经理孟凡池向《IT时报》表示,国内独角兽GPU企业的主力制程集中在7/12/14纳米,与国际领先的3/4纳米制程相比,存在明显的代际差距,导致的性能差距最高可达10倍。这意味着在处理相同复杂任务时,国产算力芯片在速度、效率等关键指标上,远不及国际先进水平,极大限制了其在高端应用场景的使用。
在算力网络架构方面,国产算力也处于初级阶段。多名GPU企业的展台工作人员也向《IT时报》记者坦言,如今仍受限于光刻机复杂的工艺流程,国产GPU发展之路还有待继续突破。
而数据数量、接口闭环等标准尚在起草之中,不同设备间的互联率较低,延迟、带宽瓶颈以及网络拥塞等问题频发,严重影响了算力资源的高效利用。即便拥有先进的智能算法体系,面对海量业务资源和复杂任务,也会因算力调度不畅,出现效率低下和资源分配不均的情况,无法充分发挥国产算力的潜力。
散热问题同样掣肘着国产算力的发展。随着GPU服务器功耗不断激增,传统风冷散热方式已难以满足需求,而液冷技术虽然被视为解决之道,但目前其成熟度仍有待提升,成本仍有下降空间。
面对通用GPU的“卡脖子”困境,中昊芯英创始人及CEO杨龚轶凡认为“多芯多技术路径”是中国AI芯片产业的必然选择,“当市场体量足够大时,定制化芯片设计的性价比将远超通用器件,至少提升2~3倍,甚至可达5~10倍,这将显著降低大模型等应用的生产成本。”
他以大模型演进为例:“去年行业普遍认为7B参数模型足矣,今年已全面迭代至70B。未来参数膨胀趋势下,唯有支持多芯片高效互联的专用架构才能承载。”
“当前算力市场正处于‘一卡难求’的饥渴状态。”孟凡池向《IT时报》透露,互联网大厂正掀起算力军备竞赛:阿里计划两年投入3800亿元,腾讯、字节跳动也斥巨资布局,但美国芯片禁令导致英伟达高端GPU进口受阻,国产芯片供应链尚未完全畅通,“对大厂们来说,目前都面临算力供应短缺,真实需求仍在持续攀升”。
据孟凡池观察,数据行业自2021年起持续下行,至2023年触底,而智算中心需求却逆势爆发。太极股份作为北京市政务云等国家级项目的建设者,正在将政务云经验转移至算力服务领域。“过去用CPU服务器组网提供SaaS服务,现在用算力服务器组建算力网。”他坦言,从去年开始,很多算力订单一减再减,不是用户需求减,是拿不到算卡,目前我们服务的终端客户,无论是国产的芯片,还是进口芯片,我觉得现在主要是缺芯,但是实际上需求还是蛮旺盛的。