近年來,隨著大數據和云計算等新一代信息技術的不斷進步,人工智能場景應用中加速落地,并快速向各個行業和領域滲透。
其中,數據是人工智能開發和應用的基礎,當前以機器學習為主的人工智能技術的高速發展依賴于底層大數據的豐富程度。強大的模型需要含有大量樣本的數據集作為基礎,數據的質量、多樣性將對算法模型的成敗產生重大影響。高質量的AI訓練數據越多,模型的準確度和重復性就越好。

《2020年中國AI基礎數據服務行業發展報告》顯示:一個新研發的計算機視覺算法需要上萬張到數十萬張不等的標注圖片訓練;一個用于智慧城市的算法應用,每年都有數十萬張圖片的穩定需求;語音方面,頭部公司累計應用的標注數據集已達百萬小時以上,每年需求仍以20%-30%的增速上升,不僅如此,隨著IoT設備的普及,語音交互場景越來越豐富,每年都有更多的新增場景和新需求方出現,對于標注數據的需求也是逐步增長。
可以說,高質量的AI訓練數據工作是推進人工智能技術落地的重要環節之一,AI訓練數據的質量和規模對于提升AI模型應用效果的成功至關重要。在這一過程中,如何從技術層面、工具層面提升人員效率、數據標注精準度,成為目前階段的重要課題。
從頭部代表企業云測數據的一系列操作中我們觀察到,專業的數據標注平臺會通過標準化的流程、方法論和人員機制,提高平臺的流程化協作能力,來保證數據服務團隊的高效的服務能力,準確地把控從創建任務、分配任務、標注流轉到質檢/抽檢等環節,實現對數據標注過程的全流程掌控,更好的提高數據標注的效率、精準度和隱私安全。

云測數據正式對外發布的其針對AI訓練數據服務的平臺產品——「云測數據標注平臺4.0」為AI訓練數據服務提供了齊全的標注工具,支持圖片、點云、視頻、文本、音頻、數據清洗等各類型的標注,并針對每種類型設置了具有代表性的標注模板,可解決AI場景落地多樣性、豐富性的數據需求。
相比傳統的采集數據、訓練模型的方式,云測數據提出了「數據在環和模型迭代在環新方式」,將數據在環開發打通,將數據采集、處理、標注、訓練、模型輸出進行持續迭代集成,實現一站式解決企業AI數據訓練需求。

提升效率方面,「云測數據標注平臺4.0」通過數據傳輸、任務創建、數據標注、數據質檢、數據交付過程的全優化,提升數據的交付效率,節省時間,從而幫助AI數據訓練綜合效率提升200%、服務成本降低60%。
「云測數據標注平臺4.0」為企業提供了處理大規模感知數據的能力,不僅降低了數據采集周期,還提升了數據標注效率,其在數據識別的準確率方面,也達到了傳統數據標注方式無法企及的高度,從工具層面為數據的質量、多樣性提供保障,從而為企業節省了大量研發時間和成本。同時極大地促進了人工智能落地的迭代周期,助力人工智能技術發展從“探索期”向“成長期”過渡,為 “數字新基建、數據新要素”為特征的新一波數字經濟浪潮保駕護航。
結語:
近日美國未來今日研究所(Future Today Institute)發布了《2021年科技趨勢報告》,趨勢報告內容表明,人工智能正以驚人的速度從學術界轉向企業,并認為未來戰爭將是一場基于數據和算法的“代碼戰”。
展望未來,數據將成為各個行業的核心資產,以高質、高效為導向的AI訓練數據工具,將成為激發數據要素新動能的強大驅動,為人工智能新發展發揮堅實底座和基礎支撐的重要作用。
轉自:中華網
【版權及免責聲明】凡本網所屬版權作品,轉載時須獲得授權并注明來源“中國產業經濟信息網”,違者本網將保留追究其相關法律責任的權力。凡轉載文章及企業宣傳資訊,僅代表作者個人觀點,不代表本網觀點和立場。版權事宜請聯系:010-65363056。
延伸閱讀