近日,在百度(BIDU.US)AI Day開放日上,百度官宣打造業界首個超頭主播羅永浩數字人,這也是業內首個多模態高度融合數字人。該技術基于文心大模型4.5T升級,實現語言、聲音與形象的協調一致。
首個多模態高度融合數字人
此前,6月15日,羅永浩數字人在百度電商首次開播。據悉,數字人直播間僅開播26分鐘創下超1300萬人次觀看、GMV突破5500萬元的行業新紀錄,部分核心品類帶貨量反超真人直播。
據百度方面介紹,此次合作主要得益于百度發布的高說服力數字人等關鍵技術突破。百度電商數據顯示,目前已有累計超 10 萬數字人主播,覆蓋電商、教育、醫療等數十個行業,驗證了數字人直播的商業可行性。
此外,今年 4 月百度發布的高說服力數字人已讓數字人帶入 3.0 時代,這是一個新的里程碑,標志著智能電商邁入新篇章,新一代高說服力數字人成為了一個像真人一樣。
百度強調,羅永浩數字人已達到媲美超頭主播的體感效果,隨著大模型與多模能力發展,數字人未來超越真人效果極具潛力。
事實上,AI 數字人融合了人工智能、計算機視覺、自然語言處理等尖端技術,能夠以高度逼真、智能的形象呈現在現實中,它可以根據不同的課程內容和教學目標,扮演教師助手、虛擬講解員、學習伙伴等多種角色。
捕捉市場風口
技術層面,各類大模型加速迭代并構建開源生態,人工智能應用場景的構建成為新的科技焦點,多模態AI成為核心突破方向,并且AI驅動數字人的應用場景正在加速落地,逐步向互聯網、文旅、金融、快消、教育等領域加速滲透。
例如相較于傳統的教學模式,AI 數字人能夠實現 24 小時不間斷的教學服務,為學生提供個性化的學習指導,精準解答疑問,引導學習思路,極大地提高了教學效率和學習效果。
專家表示,在當今數字化浪潮席卷全球的背景下,各個領域正面臨著前所未有的變革機遇,而隨著技術的不斷進步,AI 數字人作為前沿科技的結晶,正逐步走進人們的視野,而將其深度融合,并有望形成千億級新賽道。
微美全息AI算法驅動數字人體系創新
誠然,越來越多的企業與資本布局數字人領域。公開資料顯示,AI上市企業微美全息(WIMI.US),在經過技術的不斷積累和大量的市場檢驗后,將大模型與多模態技術結合,通過深度學習、動作模擬、情感模擬等算法,僅需少量真人視頻數據即可生成高擬真數字人,顯著降低制作成本,并支持低延遲、高精度的交互體驗。
此外,微美全息數字人支持語音、圖像、視頻等多模態交互,結合大模型的記憶與性格復刻能力,實現自然對話和情感化互動。同時為深化對AI驅動的交互式數字人解決方案的應用方式,微美全息依托AI虛擬數字人生成平臺,實現低成本、短周期、批量化生產,定制化設計外貌特征,滿足不同行業場景需求,提供更智能、個性化和精準的交互體驗。
結語
在當下這個挑戰與機遇并存的時期,作為由計算機圖形學、動作捕捉、AI深度學習、語音合成等計算機手段創造及使用,并具有多重人類特征的綜合產物,數字人是新一代信息技術集成創新和應用的未來產業,也是數字經濟與實體經濟融合的高級形態。未來,數字人是否廣泛滲透到傳統產業中,實現產業的向外擴展,成為繼互聯網之后的又一重要推動力?請拭目以待。
轉自:中國網
【版權及免責聲明】凡本網所屬版權作品,轉載時須獲得授權并注明來源“中國產業經濟信息網”,違者本網將保留追究其相關法律責任的權力。凡轉載文章及企業宣傳資訊,僅代表作者個人觀點,不代表本網觀點和立場。版權事宜請聯系:010-65363056。
延伸閱讀