8月20日,全球知名數據與AI公司 Databricks 正式對外發布公告,宣布公司正推進一輪規模超 10 億美元的 K 輪融資,目前相關各方已簽署投資條款清單。此次融資對應的公司估值將突破 1000 億美元(約合人民幣 7179.1 億元)。在全球未上市的初創企業中,公認估值超千億美元的玩家包括 SpaceX、OpenAI 以及字節跳動;此外,馬斯克旗下的人工智能公司在年初與社交媒體平臺 X 完成重組后,其合并融資對應的估值也已突破千億。而 Databricks 此次融資的完成,將使其成功躋身千億美元獨角獸陣營,成為全球第五家估值超千億的獨角獸企業。
Databricks 及其開源大模型觀點
Databricks 成立于 2013 年,始終聚焦于打造數據與人工智能深度融合的統一平臺,是 “湖倉一體” 數據庫架構的開創者,而這一架構正是 Data+AI 戰略落地的關鍵技術支撐。其數據智能平臺構建于開放的湖倉架構之上,為數據及治理工作提供了統一的技術底座,并結合針對企業的獨特特性優化的人工智能模型,形成了強大的技術合力。
Databricks產品包括三大模塊,全方位滿足企業在數據處理、AI應用開發及數據管理等多方面復雜需求:
· 數據湖倉:涵蓋 Delta Lake 等核心組件,實現高效的數據存儲與管理,支持大規模數據的實時處理與分析,為企業的數據流轉提供堅實基礎;
· AI 工具:旗下 MLflow 專注于機器學習生命周期管理,從模型的開發、部署到跟蹤,為企業提供便捷高效的全流程支持,助力企業輕松推進AI模型的落地應用;
· 數據工具:包含了如 Unity Catalog 等產品,具備強大的數據治理和元數據服務,全方位確保數據的安全性、合規性,同時促進數據的高效發現與使用 ,讓數據發揮最大價值。
Databricks 洞察到開源大模型正走向商品化的趨勢。而其自身強大的 AI 功能,為這一趨勢注入了強大動力。在模型訓練加速方面,Databricks 的分布式計算架構能夠充分利用大規模集群資源,顯著縮短開源大模型的訓練周期。在模型部署與管理上,Databricks 提供的一站式解決方案,能幫助企業輕松將開源大模型部署到不同的生產環境中,無論是云端還是本地服務器,都能確保模型穩定運行。同時,通過其直觀的界面,企業可以實時監控模型的性能指標,如響應時間、準確率等。一旦發現模型在實際應用中出現偏差,可立即在 Databricks 平臺上進行優化調整,保證模型在各種業務場景下持續高效運行,增強了開源大模型作為商品的可靠性與穩定性。
Databricks 以數據為基石,以人工智能為引擎,實現了從ETL到數據倉庫再到 AI 的全數據鏈路。由數據智能引擎(Data Intelligence Engine)幫助企業高效整合和處理大規模數據,將海量數據轉化為 AI 模型可直接利用的優質 “燃料”,廣泛應用于數據工程與 AI 模型訓練的協同、數據科學與機器學習的融合、AI 應用的快速落地等場景。目前,超過 60% 的財富 500 強企業都在借助 Databricks 的數據與 AI 融合平臺,讓數據更好地驅動 AI 創新,同時通過 AI 反哺數據價值的深度挖掘。
“可信數據+AI模型”賽道的中國開拓者:拓數派DataCS
拓數派作為浙江省準獨角獸、未來獨角獸企業,憑借“數據+模型”基礎AI的核心技術優勢與阿里云、DeepSeek等頭部企業共同入選“杭州基礎AI十八羅漢”。作為來自中國的全自主可控的準獨角獸,拓數派是“可信數據+AI模型”賽道的另外一個開拓者,在數據計算相關領域與 Databricks 在技術視野和商業價值上有很多不謀而合的行業趨勢共識。
在產品體系上,拓數派旗下大模型數據計算系統πDataCS(簡稱DataCS)創新性構建了平行的可信數據空間與計算空間,向上提供垂類模型全生命周期和智能體開發的工具鏈體系,向下實現對異構數據和算力的智能化調度,有效破解數據孤島和算力煙囪難題,助力企業加速數據與模型的融合,為私域大模型和智能體AI的落地提供強大支撐。
四大計算引擎提供連續動力
從數據底座架構來看,DataCS與Databricks高度相似。類似Databricks的數據智能引擎,DataCS由四大計算引擎提供連續動力,分別是:支持傳統BI分析的虛擬數倉引擎、專為模型語料庫優化的向量計算引擎、模型結合私域數據的連續訓練引擎,以及模型在異構算力下的推理引擎,為BI/大數據分析、私域垂類模型的連續訓練、垂類智能體的開發和打造等應用場景提供支撐。其中, DataCS 虛擬數倉引擎 PieCloudDB 可無縫對接三方數據和數據分析引擎,以滿足湖倉一體、數據湖等場景需求,并原生支持數據要素流轉,滿足私域客戶對數據隱私和控制權的高要求。而 Databricks 則以其 Databricks Lakehouse Platform 為核心,也融合數據倉庫與數據湖優勢,提供數據處理、分析和機器學習服務,涵蓋了數據全鏈路開發。
主動元數據無縫訪問可信數據空間
DataCS獨創的簡墨主動元數據,提供了與Databricks的Unity Catalog類似的統一元數據存儲和管理功能。該系統可無縫訪問可信數據空間,快速整合不同數據系統的多樣化數據(如結構化、時序、時空、表格、日志、圖像等),統一數據目錄以便數據發現。此外,簡墨主動元數據還內置數據觸發機制,打通私域數據和公域模型的協同鏈路,讓模型主動理解多模態數據價值,持續生成私域專屬認知智能,增強智能體的分析和落地,助力企業和政府打造自己專屬的智能體工場。
拓數派深耕私域模型和智能體及其對應的數據計算底座,目前客戶多為500強核心央國企。
DataCS 已在中國船舶、中國電子和中國航信等國家核心央企承擔智能體和垂類模型核心底座。并在多地政府落地異構算力和可信數據管理平臺,并成功投產交通、社會治理等智能體。在東吳證券、廣發證券等金融機構作為垂類模型智能體開發平臺,成功投產了秀才 GPT 和數字人等智能體。
拓數派的全自主可控特性,使其在國內私域數據服務領域筑起堅實壁壘,如同 Databricks 在美國市場憑借技術創新和市場拓展占據重要地位一樣。二者雖處于不同的市場環境,但都通過掌握核心技術和服務能力,為各自區域的客戶提供定制化、安全可靠的數據解決方案,成為推動私域數據服務發展的重要力量。
轉自:千龍網
【版權及免責聲明】凡本網所屬版權作品,轉載時須獲得授權并注明來源“中國產業經濟信息網”,違者本網將保留追究其相關法律責任的權力。凡轉載文章及企業宣傳資訊,僅代表作者個人觀點,不代表本網觀點和立場。版權事宜請聯系:010-65363056。
延伸閱讀