在"十四五"規劃全面推進國產化替代的背景下,某大型電網企業聯合鏡舟科技與騰訊云,基于全球領先的開源分析型數據庫 StarRocks 及騰訊 TBDS 大數據平臺,構建電力行業國產化湖倉一體架構。該項目實現 PB 級電力數據的統一管理,為能源行業核心系統國產化升級提供了可復制的技術范本。
一、數字電力正面臨日益復雜的數據挑戰
隨著數字化轉型深入推進,該電網企業作為服務超 2.5 億用戶的特大型能源企業,面臨著日益復雜的數據管理挑戰:
(1)數據鏈路復雜,時效性低:數據供給路徑冗長,導致延遲高,無法滿足實時性要求。
(2)資源瓶頸:計算集群資源緊張,CPU 和 IO 高負載,限制了性能擴展。
(3)高并發挑戰:先有的業務大量使用寬表設計,查詢并發壓力劇增,現有架構難以支撐。
(4)融合計算能力不足:數據分散,跨集群融合計算能力缺失,限制了個性化需求支持。
(5)數據治理難度大:全域的數據資產建設,沒有統一的主題劃分,數據分散。
二、解決方案:基于 StarRocks+TBDS 構建統一數據平臺
為解決上述挑戰,鏡舟科技作為 StarRocks 核心商業化公司,聯合騰訊云為該電網企業設計了一套分層漸進式的技術升級方案。
該方案核心在于優化數據鏈路,通過縮短供給路徑并引入實時分析引擎,有效提升數據時效性。同時,通過擴展集群規模提升資源利用率,解決計算資源瓶頸問題。
針對高并發查詢壓力,鏡舟團隊對查詢引擎進行深度優化,增強緩存機制和負載均衡能力。此外,通過構建統一數據平臺,實現跨集群數據整合和計算,滿足多樣化的分析需求,并為數據治理奠定堅實基礎。
在該電網企業實際業務場景下的 POC 測試中,StarRocks 展現了顯著的性能優勢:現網系統查詢耗時:1513 秒,StarRocks 查詢耗時:0.176 秒,實現近 8600 倍的查詢加速。
1. 基于 StarRocks+TBDS 的湖倉技術架構
該電網企業的湖倉架構包含四個關鍵層次,包含從數據采集到業務應用的全鏈路:
(1)數據接入層:Flink 實時數據處理
(2)數據湖存儲:騰訊 TBDS(Iceberg 表格式)
(3)分析加速層:StarRocks 多集群(存算一體+存算分離)
(4)業務應用層:SmartBI 等可視化工具
2. 關鍵技術提升整體性能
方案實施過程中,團隊重點解決了三大技術難題,確保系統平穩過渡的同時提升整體性能:
(1)國產化適配驗證
完成包括海光芯片和麒麟 V10 操作系統在內的全棧國產化適配驗證,保障系統在國產化基礎設施上的穩定運行。
(2)業務平滑遷移
通過支持 Greenplum 語法兼容,成功保障了存量業務的平滑遷移,并利用多集群架構實現了網級與省側業務高效協同。
(3)湖倉數據統一協同
基于騰訊 TBDS 數據湖構建統一元數據目錄,同時借助 Flink 實現實時數據入湖,StarRocks 提供強大的分析加速能力,形成完整的數據流轉與處理閉環。
數據底座:電力業務騰飛的新引擎
此次升級幫助該電網企業進一步構建統一的基礎數據底座,為各業務平臺提供數據存儲、處理、治理、建模和計算分析等全數據生命周期能力服務,支撐網省各級單位數據應用需求。
(1)業務連續性保障:StarRocks 兼容 Greenplum 近 10 萬條 SQL 語法。支持漸進式改造,存算分離與存算一體混合部署模式靈活可選。
(2)架構擴展性提升:多集群架構實現分散 MPP 集群的統一納管,彈性擴縮容能力適配業務增長需求。
(3)技術自主可控:全國產化技術棧(海光芯片+麒麟系統),并與騰訊 TBDS 實現數據湖管理標準統一。
未來,鏡舟科技將持續完善 StarRocks 與騰訊 TBDS 的深度協同,為關鍵行業提供安全可靠的數據基座。
鏡舟科技:企業級數據分析基座構建者
作為 StarRocks 開源項目的主要貢獻者及商業化領軍企業,鏡舟科技基于“開源+商業化”雙引擎模式,推出企業級產品鏡舟數據庫(Mirrorship)及 Lakehouse 解決方案:
(1)技術領先性,支持 PB 級實時分析的分布式數據庫,并深度參與 StarRocks 開源社區建設,并基于此給企業級用戶提供更多技術保障。
(2)行業實踐積累,在金融領域支撐實時風控系統建設,企業級客戶已覆蓋超百家頭部企業。
轉自:中國網
【版權及免責聲明】凡本網所屬版權作品,轉載時須獲得授權并注明來源“中國產業經濟信息網”,違者本網將保留追究其相關法律責任的權力。凡轉載文章及企業宣傳資訊,僅代表作者個人觀點,不代表本網觀點和立場。版權事宜請聯系:010-65363056。
延伸閱讀