阿扎尔签约尊龙

  • 谷歌推出“最强”TPU芯片,非GPU阵营活跃起来了

新闻动态

你的位置:阿扎尔签约尊龙 > 新闻动态 >

谷歌推出“最强”TPU芯片,非GPU阵营活跃起来了

发布日期:2025-05-24 13:31    点击次数:185

当地时间4月9日,谷歌发布第七代TPU(Tensor Processing Unit,张量处理器),并称该芯片是谷歌目前功能最强大的TPU,且是谷歌首款面向AI推理时代的TPU。这款芯片名为“Ironwood”,单芯片峰值算力可达4614 TFLOPs。

谷歌这款新芯片的特点还包括节能。相比通用的GPU(图形处理器),TPU等ASIC(专用集成电路)的特点就包括较低功耗。除了TPU,还有其他芯片希望凭借较低功耗等特点抢占AI芯片市场,非GPU阵营颇为活跃。

谷歌TPU迭代

谷歌在“Google Cloud Next 25”大会上推出了第七代TPU。“它专为大规模思考、推理AI模型设计,是谷歌迄今为止最节能的TPU。”谷歌表示。Ironwood可扩展至9216片芯片集群,性能是第六代TPU Trillium的2倍,能效则比2018年谷歌第一款Cloud TPU高出近30倍。

这款新TPU在内存带宽等方面有所改善,加快了数据访问速度。每颗Ironwood芯片的HBM(高带宽内存)容量为192GB,是Trillium的2倍。HBM带宽也有所提升,单颗Ironwood芯片的内存带宽达7.2Tbps,是Trillium的4.5倍。Ironwood芯片间互联(ICI)带宽则为1.2Tbps,是Trillium的1.5倍。

谷歌的TPU用于公司内部工作负载,不对外出售芯片,但谷歌自研的TPU部署量已经不小。据市场研究机构TechInsights数据,谷歌早在2023年就成为全球第三大数据中心处理器设计公司,位列CPU霸主英特尔和GPU霸主英伟达之后。

依托于自研芯片,谷歌在当地时间周三重申了今年的资本支出计划。谷歌计划今年斥资约750亿美元建设数据中心,押注生成式AI,这笔投资将用于构建改善谷歌核心资产所需的芯片和服务器,并支持Gemini等AI服务的开发。

一般来说,ASIC芯片的通用性比GPU弱,但适用于高效执行特定范围的功能,能耗和成本可以做到更低,业界分析人士认为这类芯片适合用于AI推理。

随着AI应用逐渐铺开,推理所需的AI芯片需求也有望增加。作为数据中心供应链上的厂商,铠侠株式会社首席技术执行官柳茂知告诉记者,市面上出现各种AI服务器,此前以训练型、学习型服务器为主,近段时间受DeepSeek等AI模型推动,出现越来越多推理型服务器。

除了谷歌TPU,其他云厂商也在自研这类能耗较低的ASIC芯片,例如亚马逊旗下有Trainium系列芯片,Meta有专为AI训练和推理设计的MTIA,微软有Azure Maia。

非GPU阵营活跃起来

除了ASIC芯片,其他新架构芯片也在迎合AI服务的灵活、低功耗需求,试图在AI时代分一杯羹。

采用RISC-V指令集架构的芯片也具备较低功耗的特点,且该指令集开源,目前RISC-V厂商也瞄准了AI服务的需求。3月,阿里达摩院的玄铁最高性能处理器C930开启交付,面向服务器级别高性能应用场景。这是一款CPU芯片,核内AI算力相比前代有所提升,采用RISC-V精简指令集,而非x86、ARM这两种目前被广泛使用的指令集。同月,睿思芯科也推出一款高性能RISC-V服务器芯片,面向智算场景。

“AI推理产生的算力需求将指数级增长,近期各行各业本地化部署DeepSeek,产生巨大的算力需求,导致很多智算中心算力供不应求,RISC-V芯片能凭借低功耗和灵活定制的优势改变这个现状。” 在近日中科创星发起的好望角科学沙龙上,中国科学院计算技术研究所副所长、研究员包云岗表示。

芯片厂商奇异摩尔相关负责人告诉记者,RISC-V架构具有开放性和可定制性,其开源和模块化特性允许开发者根据特定AI应用的需求定制指令集,从而优化性能和功耗。AI推理产生算力需求,使RISC-V在AI领域变得更加重要。

作为一种年轻的指令集架构,加州大学伯克利分校的研究团队2010年才首次发布RISC-V。另外两种主流指令集x86和ARM都较为封闭,x86基本不对外授权,企业要使用ARM架构需向其所属公司支付授权使用费,RISC-V的路径则是开源免费。但相比x86和ARM生态的成熟,RISC-V生态仍在完善过程中。此前RISC-V多应用于物联网领域,目前则在探索应用于高性能计算,例如用于AI服务。

包云岗表示,国内香山高性能处理器核IP、玄铁C930服务器芯片等推出,验证了RISC-V在高性能计算领域的可行性。市场研究机构Omdia预计,AI将对该架构芯片扩大应用有所助力,2030年基于RISC-V的AI处理器出货量将超过5亿颗。

RISC-V的研究热度也有所升温。近日东壁科技发布的相关报告显示,RISC-V领域研究自2019年起进入快速增长期,2022年进一步升温,目前该领域的研究进入稳定增长阶段。RISC-V领域的研究热点就包括人工智能与机器学习、物联网与边缘计算、拓展高性能计算应用等。国内学者发布的RISC-V相关论文数已超300篇。

不过,包云岗也指出,RISC-V在应用中还需攻克“三座大山”,分别是工具链短板、标杆案例缺失和人才缺口,尤其是人才缺口。目前该领域从芯片设计、验证、解决方案、技术支持等各个层次的人才均不足。

举报 第一财经广告合作,请点击这里此内容为第一财经原创,著作权归第一财经所有。未经第一财经书面授权,不得以任何方式加以使用,包括转载、摘编、复制或建立镜像。第一财经保留追究侵权者法律责任的权利。如需获得授权请联系第一财经版权部:banquan@yicai.com 文章作者

郑栩彤

相关阅读 AI周报| OpenAI官宣GPT-4本月底退役;中美顶级模型性能差距缩至0.3%

a16z拟募资200亿美元基金投向人工智能领域;王小川反思百川智能此前战线拉得太长。

367 04-13 09:42 “对等关税”抬高数据中心建设成本,AI在美国会变得越来越贵吗?

特朗普关税政策正在推高数据中心建设成本,阻碍电网升级,并动摇企业的投资信心。

352 04-09 09:54 我国首款全自研高性能RISC-V服务器芯片在深圳首发

灵羽处理器的发布,不仅是一项技术突破,更是一个从源头创新到产业落地的典范,这种从0到1的探索,正是中国科技突围的生动写照。

19 04-02 11:46 博通最新季度AI收入达41亿美元,盘后股价大涨12%

“我们的合作伙伴继续投资于下一代前沿模型,需要高性能加速器和有更大集群的AI数据中心。”博通总裁兼CEO陈福阳称。

83 03-07 09:07 玄铁首款服务器级CPU杀入战局,RISC-V能否叫板X86、ARM?

AI会不会叩响处理器架构革命的闸门?

232 03-01 18:04 一财最热 点击关闭

相关资讯Related Articles

  • 中议视控:可编程网络中央控制系统厂家发货效率极高

    2025-10-12

    在可编程网络中央控制系统行业,“交货周期”始终是牵动客户神经的关键痛点。无论是大型场馆建设的紧急部署需求,还是企业智能化升级的工期倒逼,设备能否按时送达现场,直接决定项目推进节奏与客户成本控制。作为国内领先的可编程网络中央控制系统研发与生产厂家,中议视控凭借一套全链路优化的供应链体系,将“高发货效率”打造成核心竞争力,用“当日发、次日达、全程可视”的服务标准,重新定义行业交付速度。 可编程网络中控...

  • 最高法:依法审理预付式消费民事纠纷案件 引导经营者诚信经营

    2025-08-20

    人民财讯8月8日电,最高人民法院发布《关于贯彻落实〈中华人民共和国民营经济促进法〉的指导意见》,其中提出,依法审理涉消费纠纷案件。发布网络消费典型案例,引导经营主体规范经营,促进网络经济、平台经济健康持续发展。落实食品药品惩罚性赔偿制度,依法规制“知假买假”,既依法维护消费者合法权益,又依法惩治违法索赔行为,保护经营者合法权益,维护正常生产经营秩序。依法审理预付式消费民事纠纷案件,引导经营者诚信经...

  • 新泉股份:关于募投项目结项并注销募集资金专项账户的公告

    2025-07-07

    证券日报网讯 6月27日晚间,新泉股份发布公告称,公司向不特定对象发行可转换公司债券募集资金投资项目(简称“募投项目”)“上海智能制造基地升级扩建项目(一期)”已完成建设并投产,公司对该募投项目进行结项,并注销募集资金专项账户。...

  • 万达商业作为被告/被上诉人的1起涉及房屋租赁合同纠纷的诉讼将于2

    2025-06-25

    本站消息,根据天眼查APP显示,近日公布了一则万达商业管理集团有限公司作为被告/被上诉人的开庭公告,详细内容如下: 案号:(2025)苏0211民初5806号审理法院:无锡市滨湖区人民法院案由:房屋租赁合同纠纷当事人信息:原告/上诉人:周某某被告/被上诉人:万达商业管理集团有限公司、大连万达商业管理集团股份有限公司、无锡万达广场商业管理有限公司、无锡万达商业广场投资有限公司开庭日期:2025年6月...