7月27日,在2025世界人工智能大会(WAIC)上正规炒股配资,中国移动与曙光存储联合启动国内首个智能存力调度平台 —— 算力中心全局统一文件存储系统。
这个名称虽然让人感到有些陌生,但本质上是从移动互联网时代过渡到人工智能时代的大背景下,我国对基础数据管理和调度能力的一次全新尝试,也是一次世界级的先进存力的真实场景实践。
它更说明了,在走向人工智能时代的道路上,中国存储企业已经做好了准备,担当中国在全球人工智能创新策源地上的坚定基石。
——导语
01
第一部分 先进存力 无问东西
据了解,作为“东数西算”战略的重要承载平台,智能存力调度平台已率先覆盖长三角、成渝、内蒙古、贵州四大国家级枢纽节点,覆盖横跨东西、联动南北的七大存力资源池,全平台自研的基础上,兼容全球8种AI芯片,对保障供应链安全、推动国家数字经济高质量发展意义重大。
要理解这个新成绩的含金量,重点在于“智能”和“调度”两个关键词。
先说宏观背景——“东数西算” 作为国家级算力资源优化战略,通过在京津冀、长三角等 8 地,建设国家级算力枢纽,以及10 个数据中心集群,构建全国一体化算力网络,将东部数据计算需求与西部绿色能源深度耦合,实现算力资源全局性的优化配置,目标是到 2025 年形成普惠易用的综合算力体系。
但我国东西部地理跨度大(如东部沿海到西部枢纽节点距离长达数千公里),这种物理距离对存储系统的设计、运行和可靠性带来了多重挑战,同时也催生了针对性的技术与机制创新。值得一提的是,工信部于今年大力推进相关工作,印发了《算力互联互通行动计划》,实现了“全国一体化算力网调度平台(1.0 版)”的落地,旨在通过统筹协调,降低东西部数据传输阻碍,推动算力网络建设 。
再说的详细一些,“东数西算”可以认为是一个总体性的提法,实际包含了“东数西算”、“东数西存”、“东数西训”等多个具体场景,每个具体场景对存力调度的需求都有各自的特点,这就更需要一个全局性、智能化的调度平台在其中发挥作用。
“数据看不全、数据理不顺、数据用不好,是目前实际应用中的三大痛点,又都和存力有着深入的联系”,中国移动数智化部云计算架构师肖爱元这样表述:“这里面包含数据中心间存在数据孤岛,跨厂商异构存储互不兼容;千PB级海量数据,无法高效、准确价值识别,难以做到数据资源统一调度;东部服务无法高质量、低延迟地访问西部‘冷数据’,数据流通利用率不足等等问题。”
而在中国移动和曙光存储的努力下,这些问题在算力中心全局统一文件存储系统的调度下,都得到很大程度的解决。
如果说算力中心是一个战场,那不同平台和节点上的异构数据,就像一群没有参过战的新兵,需要换上统一的军装、清点人数并建立编号,最后在统一的指挥下奔赴“战场”。
为此,在解决“看不全”的问题上,曙光存储实现了平台级的智能文件存储统一观测,平台可获取不同厂商多种类型的存储设备监控信息,对异构的存储信息进行统一管理,实现存力及数据分布的统一观测。
而在“理不顺,用不好”等问题的解决上,新平台的底层文件系统采用了两级架构的元数据管理模式,一级元数据负责对外整合能力,重在解决“理不顺”;而二级元数据负责管理数据的存取能力,可根据访问频次信息进行数据冷、热、温分级管理,进而将所有资源池整合为一个整体,支持数据在不同的资源池之间根据迁移策略进行自由迁移,实现了主观上“无感”的调度,进而让用户“无问东西”,实现“用的好”。
当然,实际上的智能调度平台的复杂性远超于笔者的描述,这里只是约略选择要点,让大家对东数西算大背景下的数据管理的智能化跃迁,有一个初步的感知。
事实上,考虑到中国移动算力中心整体的复杂性和对存力的极致考验,这些进展绝不如笔者描述的这般轻描淡写,而是一项超级工程。
而这个工程得以顺利实施,正是构建在中国存储产业20多年来的从无到有、从有到优,最终达到世界领先水平的坚强基石之上。
02
双雄并立的中国极简存储史
在我长期跟踪存储行业的过程中,逐渐积累了一个认知,那就是存储子系统虽然往往不像CPU、操作系统那样,是公众关注的焦点,甚至某种程度上是一个“配角”。但其技术复杂性甚至更高。我拜访过的清华大学高性能计算中心高级工程师张武生甚至指出,存储系统是整个计算机系统里技术难度最高的子系统之一。
某种程度上,这也是为何当今中国企业级存储市场上,只有曙光存储和华为两家掌握了自主的全栈存储底层技术的一层技术背景。
有趣的是,曙光和华为几乎都是在20年前,也几乎是同频、同步的开始自主存储技术体系的研发,但其出发点和路径选择,却大相径庭。
曙光存储的出发点,一般被定位于2004年。但实际上,根据我对李国杰、孙凝晖这两位院士的访问,他们都提到,甚至早在1995年,中科院计算所开始曙光系列高性能计算机的研发之始,存储子系统就是由研发人员自己写的。只不过就当时超算的整体性能而言,存储子系统还称不上性能瓶颈。
曙光总裁历军则明确地定义2004年为曙光存储的元年,原因是这一年,曙光给东方地球物理公司交付的曙光超算系统中,存储子系统已经明显的“拖后腿”。于是,孙凝晖院士的学生苗艳超博士,带了几位计算所的同事,正式进入曙光的编制,开始了名为ParaStor的分布式存储系统的研发。
简言之,曙光存储的出发,是实际应用场景倒逼下开始的。但当时市面上尚有许多进口的,或开源的存储子系统可以选择,而曙光为何却倾公司之力投入自研?李国杰院士有一段话是历史的很好注脚,他说:“我们曙光人背负着一个沉重的精神十字架在前行,那就是不论自研还是引进,都要把研究做深、把底层逻辑搞清楚,最好自己能够动手做起来。”
而华为进入存储领域,则是偶然中的必然——2001年,互联网科技泡沫破裂之后,几乎波及到所有科技公司。华为当时认为,只做通信产品,未来会面临很大的风险,需要积极寻找新的产业机会点。于是,华为商业网络部悄然成立,存储恰恰是其中一个新业务,“当时有几十个新业务,存储是到现在依然活着的三个业务之一”,华为存储资深专家张国彬如是说。
但共同之处在于,无论是曙光还是华为,最早的存储研发团队的规模都很小,都在10人以内,都是在探索中逐渐生根发芽的“幼苗”,也都是靠自己的力量逐步长大,所以先有“走的稳”,才有后来的“走的快”。
双雄成长的路径则大有所不同。
曙光存储带有更多的科学院基因,非常看重“全自研”,力求以技术深度夯实自主根基。路径选择也从软件入手,从分布式存储文件系统的研发为起步点,在不断迭代中掌握分布式锁、纠删码等核心算法的自主化,再进一步跃升到集中式存储领域。在这个过程中,曙光存储与中科院、高校广泛深度合作,主导了多项行业标准的制定。
华为的存储从硬件入手,期间经历过与赛门铁克公司合资成立华赛公司,自研+代理双路线并举,再归于华为大家庭的复杂路径。此后亦和曙光做出过共同的选择——全自研分布式文件系统,最终和曙光存储一样,都成为集中式、分布式双修的存储产业巨头。这个过程中,华为的存储业务则更体现出擅长规模化量产、重营销导向与全球化市场推广能力强的特点。
但不得不重点提及的是,虽然科学院出身的曙光,与民营商业公司出身的华为,在行事风格和路径选择上有巨大的不同,但它们的相同大于不同。
它们之间最大的相同,就是最终依赖自主研发走到了各自擅长市场的头部。
而在这十几年里,中国市场上有许多国内的高性能计算、服务器巨头,有许多本有很好技术、市场基础的IT公司,它们的能力、体量或许在21世纪初都远远超过当时的曙光和华为,但它们要么选择成为国际巨头的代理,要么成为国际巨头进入中国市场的伙伴,要么选择去优化一些有影响力的开源存储系统。
但它们都没有毅然决然的走上全自研的路线,白白放弃了中国的信息化社会全面建设、互联网、移动互联网大爆发乃至今日的AI崛起的重要时间窗口……综合来看,似乎它们的选择才是多数派,而曙光、华为的选择和成功才是少数派,但真的是这样吗?
当然不是,如果曙光和华为也选择去做“多数派”,那我们今天就会失去企业级存储的自主权,就会任由国际巨头继续赚取超额利润,就会和其它一些业务一样在今天面临随时被“卡脖子”的风险。
事实上,华为和曙光之间的竞争与竞合,是今天中国在世界存储市场中也成为重要一极的关键要素。
在具象层面,两者的确存在竞争。但这种竞争的结果是提升了中国存储产业的整体竞争力。例如,曙光 2024 年发布全球首个亿级 IOPS 的 FlashNexus ,华为则迅速跟进,推出同级别 Dorado 产品,形成 “你追我赶” 的技术跃迁。这种竞争推动中国全闪存性能从百万级跃升至亿级,使得中国企业在这个高端市场较国际厂商提前 1-2 年实现技术突破,这在中国IT史上是非常少见的。
在产业链层面,两者则非常默契的互相补位,曙光存储在高性能计算领域的存储技术上有优势,但曙光乐意为华为提供 HPC 场景的并行文件系统技术授权,而华为则投桃报李,将曙光存储的技术和产品集成至其云服务体系,共同形成了 “曙光技术 +华为市场”的良性竞争壁垒。
而在至关重要的自主可控领域,华为 Dorado 通过 7 个 9 可靠性认证,替代了EMC 高端存储;曙光 ParaStor 则通过多个百PB级项目支撑经验,实现在国计民生领域的自主可控……这样的案例比比皆是,而且将来会越来越多。
目前,中国的高端存储市场的头部已经完全由曙光、华为这样掌握了自主技术并走向全球领先的企业所掌握,这不正是几代IT人所期望的吗?
03
AI市场,中国自信的存储基石
近期,人工智能领域有一件不大也不小的事情——英伟达已经获得美国批准,将恢复H20在中国的销售,并将推出面向中国市场的全新且完全兼容的GPU。
事实上,英伟达创始人黄仁勋曾多次表达一个观点,他认为,断供并不能中断中国人工智能的发展道路;相反,中国的开源人工智能是全球进步的催化剂,让每个国家和行业都有机会参与人工智能革命。”
不管这是一位美籍华人背景的企业领袖的真心话,还是一个长袖善舞的国际企业掌门人的“高情商表达”,但他的确说明了一个事实,就是任何国家的断供,也无法改变中国成为全球人工智能重要一极的能力和事实。
当然,对这个事实,公众比较有感知的,还是在AI算力芯片、GPU卡、基础大模型这些方面,因为其不但关注度高,而且中国的产业追赶速度也相当的快,假以时日确是可以与世界领先体系并驾齐驱的。
但很少有人知道,中国在AI方面的底气,算力芯片等只是冰山露出水面的部分,真正的体系化能力在于我们已经基本掌握了发展AI的全栈技术,如深度学习框架、基础大模型、先进应用等,但起决定意义的,则必须谈到我们的存储产业发展水平。
AI极度依赖数据,对数据的应用贯穿在AI的各个环节,AI平台(智算中心)的瓶颈往往不是算力芯片,而是存力投资不够,对先进存力的应用不到位,这已经是一个公认的事实。
但从国际视角来看,中国存力在全球的评价是很高的,而且完全自主可控。
而作为AI 时代的自主可控基石,曙光和华为都对中国的AI发展起到了重要作用。
曙光存储已经是多年的中国AI存储市场头名,在前述的中国移动智算中心项目中,曙光 ParaStor 支撑超大规模模型跨地域并行训练,带宽利用率提升 30%。
华为 AI 存储 A800则通过张量、向量等新兴数据范式支持万亿参数模型训练,断点续训速度是业界 4 倍。
在边缘-中心协同架构方面,曙光推出基于欧拉系统的边缘智能终端,与华为鸿蒙实现无缝互联,在智能电网场景中完成毫秒级数据调控;华为 OceanStor Pacific 分布式存储通过近存计算架构,将 AI 推理时延降低至微秒级。
在至关重要的数据安全领域,两者则都有自研的内置硬件级加密引擎,曙光 ParaStor 支持 SM4 国密算法,华为 Dorado 实现 IO 级勒索检测。在 “东数西算” 工程中,双方联合构建的存储集群通过等保 2.0 认证,保障跨区域数据流动安全。
这种种事实,至少说明了三个重要的事实:
其一是坚持走硬核自研,才是铸就“能用、敢用、好用”的根技术的前提。
如前所述,曙光和华为正是在发展之初就摈弃了魔改开源技术等“捷径”,坚持从底层研发,确保了其存储技术路线的100%完全自主可控,才既没有“断供”风险,也没有专利纠纷,并以自主技术的创新竞争,互相推动了攻克高端领域技术等制高点的目标,这也将为中国在AI领域进入更多的根技术体系并开展自研,树立了榜样、鼓足了信心。
其二是坚持通过市场锤炼走做大做强之路。
中国是全球唯二拥有建立完善的数字技术体系的市场规模、市场基础的国家。曙光存储、华为存储的发展,某种程度上与它们身在一个拥有11.23亿网民的国度密不可分。
更重要的是,虽然信创是一个锤炼、考验技术的很好的练兵场,但曙光存储技术的发展,更多的还是在2010年以后移动互联网大爆发的背景下,在世界上用户规模最大的市场环境下通过自由竞争、自主创新得来的。
存储作为互联网、AI的基石,其难度与应用体量直接相关,如没有东数西算中庞大的数据传输和管理需求,也自然不会诞生世界级的存力智能调度系统,更不会产生FlashNexus这样的世界级产品。
其三是赋能AI时代是重要的机会。如前所言,AI的燃料是数据,AI的应用与存力密不可分,中国拥有完整的自主存储技术体系,其实是发展AI产业的一个很重要的王牌。
目前,曙光在AI存储市场的份额,华为在AI市场的影响力,都说明其对AI的前瞻投入,则是引领国产存储产业体系迈向智能化、服务化未来的战略升级。
但这仅仅是开始而已,如一次与李国杰院士的对谈中,他就特别提出——虽然半导体存储的商业寿命还有几十年甚至更久,但其天花板已隐约可见,中国企业应该从现在起就开始发展量子存储、DNA存储等前沿技术,以期在人工智能引导的世界级技术大变革中,走到领导位置,这绝非单点突破就可以实现,而需要体系性能力的多面开花。
AI与存储,后者是前者体系能力的重要保障,前者是后者创新的突破推力正规炒股配资,在中国走向全球AI创新高地的路上,一定有中国存储产业的一路陪伴。
创同配资提示:文章来自网络,不代表本站观点。