我国算力攻坚新突破:阿里自研CPU大规模应用

1个月前 (11-16 02:23)阅读2回复0
小强
小强
  • 管理员
  • 注册排名8
  • 经验值83670
  • 级别管理员
  • 主题16734
  • 回复0
楼主

► 文 吕栋

“那是阿里算力攻坚的重要打破。”

11月3日,在2022云栖大会上,阿里云智能总裁张建锋颁布发表,颠末一年营业验证,阿里首颗针对云场景研发的CPU“倚天710”已大规模应用。那是中国首个云上规模应用的自研CPU,而在将来两年,阿里云20%新增算力都将利用自研芯片。

一年前刚表态时,倚天710的跑分表示是,性能超出业内标杆20%,能效比提拔50%以上。在现实应用中,那颗“为云而生”的CPU表示愈加亮眼,倚天710云实例与飞天操做系统及CIPU合成,在数据库、大数据、视频编解码、Web办事器等核心场景中的性价比提拔30%以上,单元算力功耗降低60%以上。

搭载倚天710的办事器

在数字经济时代,算力就是消费力。无论是线上购物、视频曲播仍是主动驾驶、科学研究等,整个社会对算力的需求空前,那也鞭策了云计算的发作式增长。在当前国内“缺芯少魂”的情况下,阿里自研CPU的打破能够说是为中国云计算财产补上一块重要短板。

“云计算的开展进入了新的阶段,芯片、操做系统和上层应用的原生合成已是大势所趋,将来十年,软硬件一体化的自研计算系统是云办事商的立品之本,只要在核心手艺和产物的研发上继续立异才气抢占定义权。”张建锋表达。

水滴石穿,非一日之功。阿里的算力攻坚之路早在十几年前便已开启。

为中国云计算奠定

2007年,正值阿里营业高速开展期,淘宝网用户体量急剧增长,尤其是脉冲流量带来极大的不确定性,营业底层的IOE(IBM小型机、Oracle数据库、EMC存储)手艺架构捉襟见肘,处理营业算力不敷的问题似乎只要扩大采购规模那一条路。

2008年,就在阿里提出“去IOE”,用云计算来为浩荡复杂的营业搭建一套全新手艺架构时,震惊了互联网所有人。阿里表里,对云计算的争议不竭。但就在2009年,阿里启动操做系统“飞天”的研发,并成立阿里云,迈出算力和前沿科技摸索的第一步,也拉开了中国云计算的序幕。

展开全文

飞天操做系统用散布式架构替代了传统集中式架构,其目的就是将遍及在全世界的办事器毗连在一路,那套架构不只要让阿里巴巴内部营业实现算力自在,也要让算力成为一种可通用、能够在线获取的资本。然而,散布式系统比传统营业系统复杂度更高,当办事器数量扩大到数千台时,系统性能、不变性和运维等方面的手艺挑战就会指数级上升。

彼时,先发者美国不断饰演着云计算引领者的角色,而中国云计算根底设备落后,生态系统建立乏善可陈。那似乎在明示着中国即将“一步慢,步步慢”。就在那种自我思疑中,飞天5K的发布让国际云计算顶尖手艺的目光会聚到了西子湖畔。

2013年5月,阿里云开发完成自有大规模摆设系统和异常毛病主动化处置系统等,大幅提拔了对集群的全局掌控力,在全球范畴内初次实现单一集群5000台办事器的规模,并率先对外供给那一才能,随后短短数月再次打破单集群10K。

那也意味着阿里云早期的算力底座正式落成。2017年,阿里云第一代神龙架构问世,利用软硬合成、软硬件协同设想的形式,实现性能的0损耗,初次让云计算的算力潜力得到彻底释放。

向“硬核”进发

手艺上不竭攻坚克难,让阿里云持续多年稳坐亚太第一、全球前三云计算厂商的位置。但云计算营业的胜利,只是阿里算力长征的细小一步,那家公司起头向更底层的硬件和芯片倡议了挑战。

2017年达摩院成立,明白在AI、量子计算、主动驾驶、芯片和5G等前沿手艺范畴展开摸索互联网巨头向硬科技转身的强烈决心起头向外界传递。

与此同时,万亿美圆的云计算市场正迎来一个新的开展阶段,“去IOE”之后,硬件系统正迎来新一轮的变化。2018年,阿里成立平头哥半导体公司,起头向下定义硬件和芯片,也意味着算力的深阶进发。

2019年,平头哥发布阿里第一颗芯片含光800,实如今AI场景深度定造,创造了性能和能效比的两项第一。2021年,阿里正式发布首个通用CPU芯片倚天710,性能超越业界标杆20%,能效比提拔50%以上。更为关键的是,倚天710针对云场景设想研发,其在设想之初就兼顾了易用性,为复杂芯片应用落地难排除了庞大障碍,也为倚天710实现对外规模化商用奠基了重要一步。

与此同时,神龙计算平台也在不竭迭代,已生长为一个全新的管控和加速中心,名为CIPU,它突破了以CPU为中心的传统云计算架构,带来向上接入操做系统,向下对数据中心的计算、存储和收集资本快速云化并停止硬件加速。

2022云栖大会现场

本年云栖大会上,基于倚天710的云实例与飞天操做系统及CIPU合成,初次实现了芯片、计算架构及操做系统的协同优化,算力性价比提拔超30%,单元算力功耗降低60%,倚天710成为中国首个云上大规模商用的自研CPU,也是阿里在算力关键手艺上的严重打破。

算力的长征

过去十多年,数字经济的飞跃式开展将人类社会带到了算力时代,算力做为新型消费力,成为社会经济开展的新引擎,也被认为是权衡国力的重要目标。

中国已在那场合作中走在世界前列,截至2022年6月,中国在用数据中心计心情架总规模超越590万原则机架,办事器规模约2000万台,算力总规模超越150 EFlops,位列全球第二。

算力开展迅猛的背后,离不开芯片、办事器、数据中心和云计算等算力财产链的日臻完美,云计算重构了算力系统,为将来算力增长供给新的动力。然而,将来算力的末极形态远未到来,那也差遣科技企业不竭向新的手艺倡议挑战。

在底层计算系统构造上,阿里展开了新型计算范式的摸索。

2021年,达摩院胜利研发全球首款基于DRAM的3D键合堆叠存算一体芯片。用存算一体芯片霸占传统冯·诺依曼架构存储计算别离的性能瓶颈,打造一个新型计算系统构造。那一功效有望为将来AI场景供给更高效率的算力。

面向更久远的计算需求,阿里还在继续规划量子计算,勤奋倾覆传统计算的潜力。基于新型超导量子比特fluxonium,阿里量子尝试室胜利设想并造造出两比特量子芯片,实现单比特操控精度99.97%,两比特iSWAP门操控精度更高达99.72%,获得此类比特全球更佳程度。

算力攻坚的长征,那才刚刚起头。

0
回帖

我国算力攻坚新突破:阿里自研CPU大规模应用 期待您的回复!

取消
载入表情清单……
载入颜色清单……
插入网络图片

取消确定

图片上传中
编辑器信息
提示信息