• 數字人照進現實開啟新人生


    中國產業經濟信息網   時間:2023-03-02





    近200萬個AI數字人“上崗”直播


      AIGC,即利用人工智能技術自動生成內容,包括文字、圖片、音頻、視頻、代碼等。


      “AIGC紅極一時,絕不是一蹴而就,而是多年來數據集的積累,厚積薄發的力量。”南京星蝠科技有限公司CEO魏佳星告訴記者,過去傳統人工智能偏向分析能力,而現在人工智能已經進化到生成新內容,通過大量的訓練數據和生成算法模型,自動生成文本、視頻等。而AIGC代表AI技術發展的新趨勢,帶來智能數字內容孿生能力、編輯能力、創作能力等內容創作的新變革。


      在視頻成為信息主要表達方式的當下,視頻內容的AI自動生成超越語音、圖像等,成為AIGC的除ChatGPT以外的主要關注方向。在南京硅基智能科技有限公司,記者看到了許多和真人相比難辨真假的AI數字人。普通人只需要提供一段3—5分鐘的真人口播視頻,在AIGC技術下,僅需十幾分鐘時間就可生成一個超高擬真度的數字人主播。“在我們的技術支持下,已有近200萬個AI數字人‘上崗’,它們能代替真人出鏡拍視頻做直播,單次最長直播時長紀錄可達400小時。”硅基智能創始人司馬華鵬介紹,AI數字人的技術難點在于其核心“大腦”部分,依賴自然語言處理技術實現與人的高仿真交互。


      記者在現場看到,AI數字人的嘴型、動作和表情高度匹配,這是如何做到的?司馬華鵬解釋,這是硅基智能在行業內領先的技術,同步效果要在對話中實時推理完成,對算法和算力的要求非常高。“只有同時具備自然語言處理、語音識別和生成、視覺合成的整體AI能力,才能給用戶自然逼真的體驗。在硅基AI驅動技術和華為鯤鵬引擎的雙向加持下,打造超級人工智能算力,為高性能計算、數據庫、云計算等應用場景的工作負載進行高效加速,可廣泛應用于視頻制作、直播、多模態交互等場景。這是我們的核心競爭力。”


      “AIGC站上風口,主要體現在其‘邏輯性’,也就是除了撈取知識庫回答問題,AI已經可以通過推理判斷,進行自己的知識體系升級,給出自己獨立思考后產出的結果。”圖靈人工智能研究院總經理李強認為,“目前AI賦能內容生產在插畫、設計、醫療、教育等行業,AI通過自學習,已達到行業標準并向外輸出。”


      御風而行,AIGC將給產品帶來哪些革新?“只要有想象力,普通人也可以制作出類似‘阿凡達’的大片。”李強告訴記者,AIGC將解放人類的雙手,目前圖靈人工智能研究院重點聚焦人工智能圖像生成,已經開發了“小靈繪畫”和“AI畫靈”兩個產品,用戶基于AI算法,只要輸入關鍵詞或者一段描述場景的文字,便可在幾秒內生成一張符合意境的圖片,無論浮世繪或是賽博朋克,梵高或是畢加索。


      魏佳星則認為,智能客服產品需要強大的計算能力快速處理大量數據,而AIGC擁有巨量的語言模型,且其自然語言生成技術可以生成更人性化的回復,兩者結合,客戶將能夠得到更快速的響應,以及更準確的答案。


      數字“造人”賦能產業升級


      《中國互聯網發展報告2022》公布的數據顯示,江蘇省人工智能領域核心企業超過1000家,人工智能相關產業規模超過2000億元。江蘇人工智能產業正積極搶抓國家新一代人工智能示范應用戰略機遇,持續加強人工智能基礎層、技術層、應用層等全產業鏈研發部署。在《2021—2022中國人工智能計算力發展評估報告》中,南京、蘇州分列中國人工智能城市排行榜上第四名和第六名。AIGC在我省落地情況如何?


      “我們用AI技術造人,可為各行各業輸送大量數字勞動力。”司馬華鵬告訴《科技周刊》記者,目前人類從事著許多重復性的腦力勞動,數字人打造人類“數字分身”,幫助企業數字化轉型。硅基智能研發的數字人產品,目前已應用于數字人主播、數字人客服、數字人醫生、數字人教師等各類場景。AIGC大幅度降低了數字內容生產的成本,打破了數字內容生產受到人類想象能力和知識水平的限制。


      如近期南京市商務局啟動“南京百萬數字人創業計劃”,依托“AI數字人”技術將數字人在直播、短視頻方面的數字化優勢融入線下消費場景,可實現7×24小時全天候直播,為小店發展降本增效、聚客引流,推動實體小店智能化改造、數字化升級。“我們力爭一年內打造約20萬個數字人,服務約2000家企業;3—5年內打造約100萬個數字人,用AI技術賦能傳統行業。”


      AIGC內部技術協同也為其應用落地提供了更多“破題思路”。魏佳星告訴記者,云蝠智能AI外呼和數字人產品之間正在考慮形成一種協同效應。他解釋,兩者協同工作時,云蝠智能AI外呼可以幫助企業快速接通客戶電話,數字人產品可以與客戶進行人性化的溝通,推薦符合客戶需求的產品和服務,解決客戶的問題,實現更加精準的市場推廣。


      李強說,相信AIGC會對所有內容生成相關的行業產生深遠的影響,在文化、金融、醫療、安全、教育等領域都大有作為,例如虛擬直播人、汽車人機交互、虛擬老師、AI問診、智能客服、語言翻譯等,應用場景非常寬泛。另外,隨著AIGC技術與行業的深入融合,又會催生出很多新的市場需求,例如,對制造業數字化轉型及數字政府建設產生進一步驅動力,“而江蘇內容生態市場空間廣闊,政府隨著人工智能行業的不斷發展,對政策內容也持續進行細化,從頂層設計至創新成果轉化路徑,再到技術層面都有相應政策指導,未來路徑更為清晰。”圖靈人工智能研究院已經在相關領域開始布局。


      爆發態勢的AIGC距頂峰還有距離


      AIGC已經可比肩“類人智能”了嗎?李強的答案是,技術的發展往往是爆發式的,也許當前AIGC的這次爆發還僅僅只是開始。他舉例,現在爆紅的ChatGPT作為AIGC概念下衍生出的一個模型工具,當下的技術發展還未達到數字永生的程度,未來還未可知。目前雖然ChatGPT實現了文本生成的部分場景的“可用”,但遠沒有達到完全的“可信”,在不擅長的領域,ChatGPT會“一本正經地胡說八道”。


      據悉,目前ChatGPT背后的GPT3.5大模型,參數大概1750億個,而人腦擁有近1000億個神經元和100萬億個連接,模型的參數量級還遠沒有達到人腦的突觸數量級。并且,AIGC模型需要大量數據參與訓練,因此對算力基礎設施有較高要求,這使得頭部企業的規模優勢更加突出,腰部企業有被“腰斬”的風險。


      近期,各類AIGC產品呈井噴式出現。李強提醒用戶,過度依賴自動生成內容可能導致內容缺乏多樣性或原創性,也無法擁有批判性、共情力,所以將其作為輔助工具,用來幫助信息搜集、信息梳理、謀篇布局成為最優選。


      人工智能算法真的能做到公平、公正、無害嗎?AIGC帶來技術紅利的同時也帶來了造假、侵權行為泛濫、信息繭房、算法歧視等多重風險。目前,部分開源的AIGC項目對生成的圖像監管力度較低,數據集系統利用私人用戶照片進行AI訓練,制造虛假音視頻圖像進行誹謗、詐騙、勒索等違法行為已屢見不鮮。此外,一些用戶利用AIGC制作出暴力和性有關的畫作,一些平臺已經開始進行倫理方面的限制和干預,相關法律法規也有待進一步完善。


      對此,構建開放有序的AIGC生態尤為重要。李強認為,應鼓勵各方加速共性技術和基礎產品研發,重視人工智能技術標準的建設、產品性能與系統安全的測試,積極參與AIGC應用、治理、完善等領域的國際規則制定和全球發展合作。另外,提升關鍵技術方面,在算法技術、AI工程化等方面加強攻關,以突破算法透明度、魯棒性、偏見與歧視等技術局限,不斷打磨推出更為安全、可信、可靠的人工智能技術產品,打破技術瓶頸。


      圖靈人工智能研究院也在加速AI內容審核和防篡改能力的升級,前者可以對違規違法的圖文、視頻甚至是直播信息進行自動審核、過濾,后者基于深度學習和端到端強化學習技術,可以對圖片、文字的真實性進行鑒定。業務方的測試和實跑數據顯示,在身份證復印件、門頭照、執照復印件、特殊資質等文件類型上已達到行業最高標準,針對單張圖片的篡改檢測可以在1秒內完成。


      “技術的進步帶來身體的延展,借AI之力,人的有限性得以拓展和超越。探索用主流價值導向駕馭‘算法’,為大眾提供更具情感溫度和人文關懷的信息服務,是人工智能時代的應有之舉和努力方向。”李強說。


      轉自:新華日報

      【版權及免責聲明】凡本網所屬版權作品,轉載時須獲得授權并注明來源“中國產業經濟信息網”,違者本網將保留追究其相關法律責任的權力。凡轉載文章及企業宣傳資訊,僅代表作者個人觀點,不代表本網觀點和立場。版權事宜請聯系:010-65363056。

    延伸閱讀

    ?

    版權所有:中國產業經濟信息網京ICP備11041399號-2京公網安備11010502035964

    www.色五月.com