华为创始人任正非在接受采访时表达了对芯片问题的信心,他表示凭借“叠加和集群”等方法,华为的计算能力已能与全球顶尖水平比肩。在全球半导体竞争激烈、技术封锁加剧的情况下,这番表态令人振奋。
面对芯片制程的差距,华为通过系统级创新弥补单芯片性能不足。集群计算将多块性能稍逊的芯片通过高效网络连接,协同完成复杂任务,形成强大的整体算力。华为的昇腾910B芯片就是一个例子,虽然在制程上不及国际领先的3nm芯片,但通过自研的CCE通信协议构建高效集群,支持了盘古大模型的训练,整体算力可媲美部分顶级GPU。
科技企业在“以量补质”策略方面不断探索。谷歌的TPU集群是一个典型案例。尽管谷歌的TPU v4芯片单片性能略逊于英伟达A100,但谷歌通过Cloud TPU集群成功训练出5400亿参数的PaLM模型。这证明在人工智能等擅长并行处理的任务领域,集群计算的规模效应能够有效弥补单芯片性能上的差距。
华为在算法优化方面同样表现出色。任正非提出的“用数学补物理”理念体现在采用稀疏计算、模型量化和剪枝等前沿技术手段,降低硬件性能依赖。华为的MindSpore框架通过动态图优化和低精度计算,使AI训练的计算需求降低了30%以上。DeepSeek模型借助高效的模型压缩技术,在普通服务器上良好运行,挑战传统高性能硬件的优势地位。这种软硬件协同优化模式帮助华为在制程相对较低的情况下依然实现高效计算。
天津港无人化码头运营情况生动诠释了这一优势。数百块昇腾芯片组成的计算集群在天津港无人化码头中发挥着关键作用,实时处理海量传感器数据,精准指挥无人驾驶集卡和智能吊机。AI集群不仅提升了效率,降低了能耗,还让码头工人从高强度体力劳动中解放出来。
华为的底气不仅源于技术,还在于其开放包容的战略眼光。任正非强调“利用别人先进成果”,促使华为在全球技术生态中积极作为、灵活应变。即便面临制裁困境,华为依然通过与开源社区及国际伙伴的深度合作整合资源。例如,昇腾芯片与PyTorch等主流开源框架兼容,降低了开发者的迁移成本;Atlas平台则通过软硬件协同构建独特竞争力。
AMD的崛起为华为提供了借鉴。AMD曾被英特尔压制,但CEO Lisa Su带领团队采用模块化设计(Chiplet)和高效互联技术,推出Zen架构处理器,强调架构和生态而非单一制程。AMD的EPYC处理器在2020年占据全球服务器市场约15%的份额。这一成功经验与华为聚焦5G基站和AI计算等特定场景,通过针对性优化使效率远超通用芯片的集群策略有异曲同工之妙。
Chiplet技术是任正非战略思想在工程实践中的体现。该技术通过架构革新和系统级优化,弥补了单芯片制程上的代际差距,实现了整体性能的实用化突破。传统“摩尔定律”依赖制程微缩提升性能,但先进制程面临物理极限和外部封锁。Chiplet技术将复杂的大芯片拆解为多个功能明确的小芯粒,根据功能需求采用不同工艺节点制造。通过2.5D/3D集成等先进封装技术,将这些异构芯粒高密度、高性能地集成在一起,从而在系统层面实现媲美甚至超越单一先进制程大芯片的性能和功能。
然而,Chiplet架构也面临芯粒间高速、低功耗、高带宽互连的挑战。华为在高速SerDes、先进封装中的互连线设计、信号/电源完整性仿真以及低延迟高带宽的互连协议等方面投入巨大,通过复杂的算法优化数据传输路径,降低噪声干扰,提升能效比,克服物理距离、封装寄生效应带来的信号衰减和延迟等限制,确保多个芯粒高效协同工作。
华为深刻认识到人才的重要性。华为拥有约11.4万名研发人员,过去十年研发投入超过1.2万亿元。“天才少年”计划吸引了众多顶尖人才。这些人才深入参与昇腾AI芯片的架构设计,确保硬件原生高效支持稀疏特性,实现了算法创新与芯片设计的深度协同。
尽管如此,挑战依然存在。集群计算在能耗、成本以及通信瓶颈等方面仍有待突破。在对单线程性能要求极高的部分科学计算场景中,集群优势难以充分发挥。若华为能在芯片制造、供应链稳定性和全球化布局上持续精进,便能在更广泛的领域与国际巨头一较高下。
任正非“芯片无需担忧”的宣言背后,正是华为在集群计算、算法优化和生态协作等方面的深厚技术积累,以及其对人才和教育的长期战略性投入。当硬件发展受限时,系统创新和生态协作成为破局的关键力量。