FPGA也能干翻GPU?这家美国小公司让人深思
说起AI芯片,大家第一反应肯定是英伟达的GPU,毕竟这家公司已经把AI训练和推理市场吃得死死的。但最近有个叫Positron的美国小公司,居然用FPGA来挑战英伟达的地位,而且数据还挺唬人的。Positron这家2023年才成立的公司,居然已经把AI加速器送到了美国各地的数据中心,他们的Atlas系统在AI推理任务上,性能功耗比比英伟达H100强3.5倍,能耗比也是3.5倍。
说起AI芯片,大家第一反应肯定是英伟达的GPU,毕竟这家公司已经把AI训练和推理市场吃得死死的。但最近有个叫Positron的美国小公司,居然用FPGA来挑战英伟达的地位,而且数据还挺唬人的。

Positron这家2023年才成立的公司,居然已经把AI加速器送到了美国各地的数据中心,他们的Atlas系统在AI推理任务上,性能功耗比比英伟达H100强3.5倍,能耗比也是3.5倍。更夸张的是,在跑Llama 3.1 8B模型时,他们的系统只用2000W就能达到每用户每秒280个token,而英伟达的8路DGX H200服务器要用5900W才能跑到每用户每秒180个token。
这个对比听起来有点不可思议,毕竟GPU在AI领域的统治地位好像已经是铁打的事实。但仔细想想,FPGA的优势其实一直都在那里,只是很多人没注意到而已。
GPU本质上是为图形渲染设计的,虽然后来被用来做通用计算,但终归不是专门为AI而生。FPGA呢?它是可编程的硬件,你可以把它理解为"软件定义的芯片",想要什么功能就直接在硬件层面实现什么功能。
Positron能够把任何训练好的HuggingFace Transformers库模型直接映射到硬件上,获得最大性能和易用性。这意味着什么?就是针对特定的AI模型,FPGA可以变成一个专门为这个模型量身定制的芯片。
中国的FPGA困境
说到这里,就得聊聊一个让人思考的问题:为什么在AI芯片这么火的当下,中国很少看到用FPGA做AI芯片的公司?
目前FPGA市场仍由美国三大巨头Xilinx(被AMD收购)、Altera(被Intel收购)、Lattice主导,占据八成以上的份额。这就是问题的根源。
FPGA看起来简单,但实际上门槛极高。不只是芯片本身的设计制造,更重要的是整套工具链的建设。你想想,一个FPGA芯片没有配套的开发工具、编译器、调试器,那就是个废物。而这些软件工具的开发,往往比芯片本身还要复杂。
Xilinx的Vivado、Altera的Quartus,这些开发环境经过几十年的积累,功能强大到让人绝望。国内的FPGA厂商,硬件可能能做得还行,但软件工具链往往差了好几个档次。
Positron敢于公布具体的性能数据,说明他们对自己的技术有信心。但这种信心的背后,是对FPGA技术多年的深入理解和工程实践。他们不是在实验室里玩概念,而是真的把产品推向了市场。
从更宏观的角度看,Positron的成功其实反映了一个深刻的问题:在技术发展的道路上,主流方案未必是最优方案。
GPU之所以成为AI芯片的主流选择,很大程度上是历史的偶然。当初深度学习刚兴起时,研究者发现GPU的并行计算能力正好适合矩阵运算,于是就用上了。后来英伟达顺势而为,针对AI场景不断优化GPU架构,最终形成了今天的格局。
但这不意味着GPU就是AI计算的终极答案。FPGA的灵活性、专用ASIC的效率,都有各自的优势。Positron的例子告诉我们,在特定场景下,FPGA可能是更好的选择。
对于中国的AI芯片产业来说,Positron的成功或许提供了一个新的思路。与其在GPU赛道上跟英伟达硬碰硬,不如考虑差异化的技术路线。
但这条路不好走。FPGA技术积累、工具链建设、生态构建,每一个环节都需要长期投入。更重要的是,需要有人愿意踏踏实实地做这些"不性感"的基础工作。
Positron用了两年时间就把产品推向市场,这背后肯定有深厚的技术积累。对于国内的创业者来说,也许应该更多地思考如何利用自己的技术优势,而不是一味地跟风热点。
毕竟,在芯片这个行业里,真正的颠覆往往来自于对技术本质的深刻理解,而不是对概念的炒作。
更多推荐
所有评论(0)