• 中國電子云:構建新質算力基礎設施


    中國產業經濟信息網   時間:2024-08-20





      2024年政府工作報告提出,適度超前建設數字基礎設施,加快形成全國一體化算力體系。隨著“人工智能+”政策的全面推進,我國迎來了智能化高質量發展的嶄新時代,承載智能應用的先進算力將成為新質生產力的重要引擎。


      在中國電子首席科學家、中國電子云總工程師朱國平看來,新質算力基礎設施就是在云原生疊加AI原生的設計理念下,將算力、數據、先進存儲和安全進行深度融合,用于高效承載數據和人工智能的新型基礎設施,同時提供基于AI安全的可信數據空間,以及以數據驅動的AI原生應用的開發范式。


      聚焦政企和關鍵行業發展新質生產力的要求,中國電子正在打造智算芯片、智算操作系統、智算服務器和一體化算力平臺,建設服務金融、政務和央企等關鍵基礎行業的新質算力基礎設施。


      云原生+AI原生 構建新質算力基礎設施核心能力


      “云原生+AI原生”是新質算力基礎設施的要義所在,也是中國電子云(中國電子旗下唯一云計算品牌)構建技術體系的核心。


      其中,云原生是中國電子云的起點。曾經,云計算有兩條主要的技術路線,一類是基于OpenStack進行優化和改造,一類是基于容器化、微服務、DevOps等技術的云原生。在中國電子云成立的2020年,云原生已經被產業公認為最佳技術路線。因此,中國電子云從一出生就選擇了更加先進的云計算技術,形成了所謂的“后發優勢”。CECSTACK正是基于云原生技術自研的國產化企業級云平臺,亦是中國電子構建新質算力基礎設施的載體。


      在研發過程中,中國電子云發現,不同領域用戶早期云平臺的底層標準不統一,在業務遷移上云的過程中需要兼容不同的芯片、服務器和操作系統,且上層還要支撐各種創新應用的落地。鑒于用戶實際部署的難題和云計算產業的最新趨勢,CECSTACK在研發之初就堅定基于云原生技術,實現“一云多芯”的能力,不僅自研了分布式云原生云操作系統,還在一個資源池內部支持多種異構的CPU,從而有效屏蔽硬件差異,助力應用無感知快速上云。


      而AI原生,則是在系統設計階段就充分考慮如何支持AI負載的訓練和計算需求,將AI所需的服務和優化內置到系統中,客戶可以直接基于CECSTACK訓練AI模型或運行AI應用,無須再進行基礎設施的改造或投入。


      比如在計算架構上,CECSTACK采用了與云平臺“一云多芯”一脈相承的“一云多智芯”架構,與國內外幾乎所有主流的人工智能加速芯片進行了適配和聯調。在網絡上,CECSTACK支持InfiniBand、RoCE等AI數據中心常用的網絡解決方案。在存儲方面,CECSTACK以分布式存儲系統適應AI負載不斷增長的數據量和復雜性,并融合了閃存技術和混合閃存技術,推出了針對人工智能訓練場景的全閃存儲,以及針對人工智能推理和歸檔場景的混閃存儲。


      從“想到”到“做到” 打磨技術創新和工程實現能力


      雖然“云原生”“一云多智芯”“AI原生”這些概念在命名上非常簡潔,但“想到”和“做到”之間隔著大量的設計、適配和調優工作,考驗著中國電子云團隊的技術創新和工程實現能力。


      記者在采訪中了解到,在構建并融合云原生與AI原生的過程中,中國電子云團隊有三條經驗。


      一是基于嚴謹的測試持續優化系統。比如在建設北京亦莊人工智能公共算力平臺的過程中,中國電子云圍繞提升模型訓練效率的目標,對全路徑的數據進行測試,檢驗哪個位置的數據耗時最長,有針對性地進行優化。


      二是提升對客戶需求的分析和響應能力。中國電子云團隊注意到,大模型訓練往往耗時幾個月,必須提升網絡面對中斷或意外事件的健壯性。因此,中國電子云構建了快速生成checkpoint(保存檢查點)的能力,即便模型訓練中斷,也能夠基于checkpoint接續訓練。


      三是構建全流程改造能力。由于CECSTACK的算力、存儲、數據系統均為自研,因此不需要第三方提供接口來進行數據采集,也無須委托第三方進行優化,在調優和迭代上更加高效可控。


      目前,中國電子云累計建設超過3300P先進智算算力,包括北京亦莊人工智能公共算力平臺的3000P算力、石家莊人工智能計算中心的100P算力、位于武漢的中國電子云可信智算中心的100P算力,以及中國電子信創云基地的100P算力。中國電子云不僅為以上智算中心或智算平臺提供一體化的算力平臺,也嘗試參與運營,與當地政府一起理清如何高效供給和利用算力等關鍵課題。


      “在亦莊3000P算力的建設過程中,我們在大規模的基礎設施上對產品進行了驗證、打磨和優化。客戶提出的要求比較高,促使我們不斷迭代和更新產品。這是建設過程中的最佳實踐,對團隊的能力提升是巨大的。”朱國平告訴記者。


      高效、安全雙輪驅動 打造穩定可靠的新質數字底座


      培育和發展新質生產力,需要處理好發展與安全的關系。習近平總書記強調,要圍繞發展新質生產力布局產業鏈,提升產業鏈供應鏈韌性和安全水平,保證產業體系自主可控、安全可靠。


      中國電子云在創立之初,就兼顧了高效和安全的內在要求。其母公司中國電子作為網信產業國家隊,不僅攻克了計算機CPU和操作系統關鍵核心技術,也形成了“系統優化、行業定制”的發展模式。首先,中國電子云基于中國電子完備的自主計算產業體系,以安全為先,包括技術安全、架構安全和長期安全服務。其次,中國電子云采用了“公有云服務+專屬公有云產品”的運營模式,兼顧了公有云的高效便捷和私有云的安全可控。最后,中國電子云硬件上支持x86架構、異構計算架構,軟件上與合作伙伴廣泛適配并擁抱開源。


      基于差異化的能力,在已經成為紅海市場的云計算領域,中國電子云捕捉到了三個市場機遇。一是面向政企和關鍵行業提供數字基礎設施,此類客戶普遍對數據安全有著極高的要求,無法將業務部署在公有云,存在大量專屬云的市場機會。二是抓住信創改造和升級帶來的市場機會。三是人工智能高速發展帶來的智算中心系列產品的機會。“因此我們的產品策略有兩個,一是以信創為根本,二是‘all in AI’。”朱國平表示。


      憑借高安全、高性能、高彈性的數字底座,中國電子云受到中央企業和關鍵行業用戶的青睞,成功承建了一批央企云平臺和行業公共服務基礎設施。


      在關鍵行業領域,基于CECSTACK建設打造的南方電網調度云異地災備平臺,按照“兩地三中心+按需建設省級分中心”模式,構建一體化全棧云平臺,有力支撐了新型電力系統建設,保障人民群眾用電安全。中國電子云與華電電科院、國電南自華盾公司合作開發的國內首個行業級自主可控燃機智慧運維云平臺“中國華電燃機智慧云”采用“1+N”的云邊協同架構,通過使用燃機智慧運維云平臺,僅運行優化一個模塊,電廠一年就可以節省50萬到100萬元。


      在信創改造領域,中國電子云與金電云在金融信創領域密切合作,建設了銀行電子憑證互聯互通平臺,以解決銀行電子憑證領域存在的機構多頭連接、接口重復開發、系統重復建設等痛點難點。雙方按照金融云等級標準,科學布局“多地多中心”,構建綠色先進高效的算力體系和一云多芯云平臺,為全國范圍內的中小型金融機構提供涵蓋IaaS、PaaS、SaaS的專業化云服務。截至2023年11月,該互聯互通平臺累計完成業務轉接總量超276萬筆。


      AI+未來 緊抓計算產業最大變量


      人工智能被視為發展新質生產力的主要陣地。發展人工智能,已經成為央企和關鍵行業轉型升級、提升核心競爭力的要求。接下來,中國電子云將以CECSTACK為抓手,以構建新質算力基礎設施為目標,持續提升和完善智算交付能力。


      “AI會無處不在,這是計算產業最大的變化,也是民眾生活的最大變量。新質算力基礎設施要同時滿足人工智能發展和數據要素流通。目前,我們已經具備了賦能AI和數據要素的能力,會將為客戶提供一體化的AI服務作為接下來的努力方向。”朱國平表示。


      不過,采訪中記者了解到,在推動新質算力基礎設施的過程中,中國電子云也面臨一些產業共性的難點。一是算力的獲取。一方面,美國對英偉達向中國出口產品的限制,導致高端算力芯片的獲取更加困難;另一方面,國產算力芯片的性能還有待提升。二是基礎設施需要進一步完善,尤其是算力基礎設施的大規模互聯和測試,還缺乏成規模的實際部署案例。三是AI軟件工具鏈不夠成熟,相比英偉達CUDA等國際領先企業的生態布局,國內需要加強軟件和應用生態培育。


      “發展新質生產力需強化企業科技創新主體地位。”圍繞企業如何踐行新質生產力,以及全社會如何更好地支持企業發展新質生產力,朱國平提了三個建議,一是企業踐行新質生產力不能脫離自身的實際情況,要結合業務實踐,通過AI等新技術的賦能,優先將原有業務做得更好。二是要建設高質量的數據集,人工智能大模型的開發和訓練需要高質量語料庫和基礎科學數據集,各行各業要運用AI等新興技術的能力,也需要高質量動態數據集的支持,這需要有關部門及整個產業鏈的共同努力。三是建設更加包容的創新環境,創新是逐步積累、逐步改進的過程,包容的環境能夠鼓勵企業人才勇于創新,更好地激發企業的創新活力。(記者 張心怡 連曉東)


      轉自:中國電子報

      【版權及免責聲明】凡本網所屬版權作品,轉載時須獲得授權并注明來源“中國產業經濟信息網”,違者本網將保留追究其相關法律責任的權力。凡轉載文章及企業宣傳資訊,僅代表作者個人觀點,不代表本網觀點和立場。版權事宜請聯系:010-65363056。

    延伸閱讀

    ?

    版權所有:中國產業經濟信息網京ICP備11041399號-2京公網安備11010502035964

    www.色五月.com