《2015年中國大數據交易白皮書》顯示,預計到2020年,中國大數據產業市場規模將是2014年規模的10倍,由2014年的767億元擴大至8228.81億元。全球大數據市場高速增長,已經成為全球IT領域中的增長亮點。在中國盡管大數據仍處于起步階段,但各地發展大數據的積極性較高,行業應用推廣迅速。在這個熱情高漲的大數據市場,中國要想進一步釋放大數據的價值,掌控大數據的技術話語權,必須關注大數據的基礎技術。
眼下,雖然中國對大數據的熱情很高,但我們必須看到目前中國在大數據關鍵技術上的布局其實是有所欠缺的。目前世界各國都在搶先布局大數據的關鍵技術、基礎技術,因為從目前的技術架構和技術基礎來看,用現成的技術來解決大數據的問題還面臨諸多的挑戰。不久前,IBM中國研究院院長沈曉衛接受《中國電子報》記者采訪時坦言,我們要想真正從數據中獲得洞察、獲得價值,需要更高效、更智能的數據處理和分析平臺,以及相應的工具。其一,傳統的IT技術,需要有更大的突破。比如物聯網處理系統需要一秒鐘處理上百萬信息,比如對非結構化的數據進行存儲和處理,需要新的技術。其二,需要引入物理模型來模擬物理世界。比如對天氣的理解,比如對疾病的風險控制的理解,比如對智能工廠的理解,都需要構建大量的物理模型,并挑出更合適的模型,對物理世界作出更好的模擬和理解。其三,需要更強大的認知計算,要求認知計算有更強大的自然語言的能力、更強的機器學習能力等。
基于對市場需求和技術趨勢的判斷,事實上國外IT巨頭在大數據的關鍵技術上投入了大量人力、物力和財力來進行關于大數據關鍵技術的研發。我們大家都知道現在談及大數據的利用,一定都會提及開源的Hadoop技術,事實上對于大數據的利用僅僅依靠Hadoop是不夠的。我們朝向產業互聯網推進時面臨非常多的挑戰,我們的計算架構、計算模式也面臨很大挑戰。比如傳統的計算機分析和數據整理方式,首先是收集數據,然后儲存在數據庫程序中,然后在收到請求后搜索這些數據。這是一個高效的處理方式,但卻是一個緊繃的結構,而且通常會造成時間的浪費。而在流計算當中,高級軟件的運算法則在接收流數據時就開始對其進行分析。流計算在實時數據分析領域具有巨大的應用空間,包括天氣、江河、電力、股票交易等等。但目前,中國的IT產業在流計算方面并沒有太多的話語權。面對大數據的挑戰,有非常多類似流計算的新技術,關鍵技術都需要中國IT企業做更多的布局,只有這樣,我們的大數據發展,大數據利用才不會變成“無根”的產業。
事實上不僅僅是在平臺和工具等基礎技術維度,中國要想在大數據領域擁有更大的話語權,更好地釋放數據的價值,還必須在數據模型的維度、在數據科學家等維度進行大量的投入。目前全球前1500強的企業都有自己的數據科學家。據國外職業人士社交網站LinkedIn公布的2014年最受雇主喜歡、最炙手可熱的25項技能,統計分析和數據挖掘技能位列榜首。研究機構Gartner預測,2015年,全球將新增440萬個與大數據相關的工作崗位,25%的組織將設立首席數據官職位。
不久前,阿里云宣布啟動阿里云大學合作計劃AUCP,聯合國內8所高校開設云計算與數據科學專業方向,目標是到大學里培養大數據的科學家。應該說阿里巴巴是國內企業中“大數據意識”覺醒比較早的企業。對于大數據這樣的應用學科的人才培養,需要充分借助企業的資源。在國外企業中,IBM對于全球大數據的人才培養投入了巨大資源,已與全球1000多所大學一同合作,構建一個輸送數據科學家的“通道”。
推進大數據應用需要大量的數據科學家,需要教育體系更重視大數據的人才培養,需要更多的領先企業參與進來,僅僅有阿里巴巴或者是IBM是遠遠不夠的。
專家觀點
中國工程院院士李德毅:挖掘數據價值要關注“小數據”
大數據來源于人類測量、記錄和分析世界的渴望和無盡的追求。隨著各種技術的迅猛發展和廣泛應用,人類獲取數據的手段越來越多,大數據已成為網絡時代人類社會的重要資產。
模型和程序要圍著數據轉,現在是大數據、小模型、小定律互相交叉,即使是同一個癌癥病,每個患者的表現也都不一樣,所以要關注對小數據、小群體的研究,因此創新表現在對交叉學科的形式化理論上。要更多地關注小眾,而不是做特例發表論文。
云計算要充分確定大數據中的不確定性和價值的隱蔽性,跨界構建基于統計的可變視角和可變尺寸的全新發展空間,大數據將驅動云計算架構中心的演化和進化,滿足及時發現大數據價值的需求。
貴陽大數據戰略重點實驗室主任連玉明:“塊數據”是拉開大數據序幕的真正推手
“塊數據”是拉開大數據序幕的真正推手,風口之上,得“塊”者得天下。“塊數據”可以將以往那些分散的、碎片化的行業數據、領域數據連接起來,把以往那些“數據孤島”連成一片,找出改造世界的方法。
怎樣區分“條數據”和“塊數據”?比如7和8是單獨分開的數字,這是“條數據”;當它產生活性時,就會發生變化,7和8便會有多種重構形式,比如7乘以8等于56;7加8等于15;7和8組合成78等,這些便構成了“塊數據”。
數據時代是融合的時代,運用好大數據,將發展指數、城市指數、生活指數等覆蓋到生活的各個方面,這將對城市管理、公共服務等提供巨大幫助。貴陽利用“塊數據”對多個領域進行管理,這將迎來新的投資熱潮。
北京大學計算機系教授陳鐘:應該讓真正懂大數據的人去做應用
我國在大數據應用方面長期欠賬,存在數據應用的跳躍問題。
我們小數據利用還沒有做好,開始做大數據應用,在技術、意識觀念上都有欠缺,需要一步一步夯實,尤其是在數據采集的準確性上,需要將基礎應用做好,讓真正懂大數據的人去做應用。美國相當一部分數據處理的機構和企業都是在數據處理分析上持續了幾十年,所以對于大數據要做好長期發展的準備。
大數據涉及個人隱私,也涉及一些敏感性數據,需要分類治理公共的、敏感性的或是有隱私的數據。中國對于數據保護的法律法規還需要完善,購買公共數據做大數據應用服務,也需要法律支撐。大數據領域的安全不僅僅是網絡安全、信息安全或是基礎安全,還有大數據的延伸應用以及它帶來的行業影響。
轉自:中國電子報
【版權及免責聲明】凡本網所屬版權作品,轉載時須獲得授權并注明來源“中國產業經濟信息網”,違者本網將保留追究其相關法律責任的權力。凡轉載文章及企業宣傳資訊,僅代表作者個人觀點,不代表本網觀點和立場。版權事宜請聯系:010-65363056。
延伸閱讀