當AI技術深度融入社交領域,Z世代對“自然交互”“情感共鳴”的需求正推動行業從“工具化輔助”向“人性化陪伴”升級。聚焦年輕群體的社交平臺Soul,憑借自研端到端全雙工語音通話大模型的技術突破,打破傳統人機交互的“輪次對話”桎梏,為年輕用戶打造出更具真實感、更富溫度的社交新場景,也為AI社交的發展提供了“技術+人文”融合的實踐樣本。

在數字化社交語境中,傳統語音交互多采用VAD(話音活性檢測)機制與延遲控制邏輯,陷入“一問一答”的機械循環——用戶需完整說完一句話,AI才能啟動回應,不僅割裂對話節奏,更難以傳遞語氣起伏中的細膩情緒。這一痛點與Z世代追求“無壓力社交”的需求形成鮮明反差,他們迫切期待更自然、無割裂感的交互模式,以緩解語音溝通中的尷尬與緊張。正是基于對用戶痛點的深度洞察,Soul歷經多輪技術迭代,推出升級后的端到端全雙工語音通話大模型,從交互邏輯層面實現根本性突破。
新模型的核心優勢,在于賦予AI自主決策對話節奏的能力。與傳統模型不同,它摒棄了依賴VAD的被動響應模式,可主動打破沉默、適時打斷補充、實現“邊聽邊說”,甚至能通過時間語義感知、環境音識別調整互動策略——比如在用戶分享趣事時,AI會以自然的語氣詞“哇”“好有意思”實時回應,而非等待對話結束。同時,模型搭載多維度情緒理解模塊,能捕捉用戶語音中的情緒波動,無論是焦慮時的語速加快,還是開心時的語調上揚,都能匹配對應的情感反饋,讓交互擺脫“機械感”,更接近現實中朋友間的聊天狀態。

目前,這一技術正陸續在多元社交場景落地驗證。例如,在不久前的WAIC大會上展出的在Soul“群聊派對”場景中,全雙工語音AI主持人成為“氛圍粘合劑”:當用戶討論陷入停滯時,AI會結合主題拋出“最近發現的小眾愛好”等話題;當多人同時發言時,AI能判斷說話優先級,避免對話混亂,提升群聊參與度。在1V1語音互動中,技術則有效降低了社交門檻,社交內向用戶無需刻意組織完整語句,可像與熟人聊天般自然插話、補充觀點,從實際反饋來看,越來越多用戶因這種“無壓力交互”更愿意開啟語音對話,社交時長與互動頻率均有明顯提升。此前在2025世界人工智能大會(WAIC)現場,Soul還展示了該技術向視頻領域的延伸方向:結合實時視頻生成能力,未來用戶可與AI進行“面對面”的全雙工視頻互動,構建更立體的“數字人格”聯結。
技術的終極價值,始終指向人的需求。從2016年成立之初便懷揣著“讓天下沒有孤獨的人”的美好愿景,到如今以全雙工語音技術打破人機交互壁壘,Soul的探索始終圍繞“技術服務情感”展開。隨著全雙工語音在多模態交互、多人場景的進一步優化,平臺將持續推動AI從“高效工具”向“有溫度的伙伴”轉變,讓每個年輕用戶都能在數字社交中找到自然表達、深度共鳴的空間,為AI社交行業的健康發展注入人文力量。
【版權及免責聲明】凡本網所屬版權作品,轉載時須獲得授權并注明來源“中國產業經濟信息網”,違者本網將保留追究其相關法律責任的權力。凡轉載文章及企業宣傳資訊,僅代表作者個人觀點,不代表本網觀點和立場。版權事宜請聯系:010-65363056。
延伸閱讀