• 金融壹賬通Gamma Lab榮獲LIC2021機器閱讀理解競賽第一名


    中國產業經濟信息網   時間:2021-06-08





      近日,由中國計算機學會、中國中文信息學會和百度公司聯合舉辦的2021語言與智能技術競賽落下帷幕。金融壹賬通人工智能研究院Gamma Lab登頂機器閱讀理解任務榜單,在與思必馳、漢儀字庫、華中科技大學等單位競賽中,取得第一的好成績。據悉,該項賽事自2019年起至今已成功舉辦三屆,是國內自然語言處理領域最權威的競賽之一,在業內具有廣泛影響力。

      金融壹賬通人工智能研究院Gamma Lab憑借雄厚的技術實力、豐富的金融行業應用場景和高速的成長性等優勢,獲國際權威財經媒體《財資》(The Asset)頒發的年度金融科技團隊獎。此外,Gamma Lab信息抽取技術、微表情識別、面部動作單元識別、機器閱讀理解、自然語言生成、情緒識別、深度學習模型推理性能等技術均取得過世界第一的好成績。此次獲獎也是繼英文機器閱讀理解(斯坦福機器閱讀理解競賽SQuAD)之后,Gamma Lab在中文機器閱讀理解方面技術積累的又一體現。

      作為自然語言處理領域最具挑戰的任務之一,機器閱讀理解不同于傳統的問答系統,無法通過預設的規則與知識庫直接反饋提問結果,而是需要從文章上下文中尋找線索,利用一定的語義信息與推理能力定位準確答案,同時需要考慮無答案、問題或原文表達差異、依賴先驗知識等問題。

      金融壹賬通Gamma Lab相關負責人表示,當前的機器閱讀理解數據集大多都只采用單一的指標來評測模型的好壞,缺乏對模型語言理解能力的細粒度、多維度評測,導致模型的具體缺陷很難被發現和改進。為了解決這個問題,主辦方建立了細粒度的、多維度的評測數據集,推動閱讀理解評測進入“精細化“時代。同時,主辦方提供大規模中文數據集,其中樣本均來自于實際應用場景,難度大,考察點豐富,覆蓋了真實應用中諸多難以解決的問題。

      此次競賽具備兩大難點:一是細粒度測評指標:相比以往比賽,從詞匯理解(vocab)、短語理解(phrase)、語義角色理解(semantic role)、容錯性(fault-tolerant)、推理(reasoning)5類12方面考察模型能力,對模型的推理性、泛化性、穩定性及知識融入是嚴峻挑戰;二是無答案樣本:數據集中含有一定規模無答案樣本,此類樣本的上下文描述看似與提問意圖接近、實際卻找不到正確答案,不僅影響數據平衡,還對模型有干擾作用。

      針對以上難點,Gamma Lab應用了行為型微調(Behavioural Fine-tuning)、多模型集成等技術策略,從而從競賽中脫穎而出,取得了第一的好成績。

      除了不斷精進自身的科技能力外,Gamma Lab一直積極將基于閱讀理解的技術賦能金融業務,為智能審單、股類承做、坐席質檢、政策查詢等業務提供支持。以智能審單技術為例,對一筆企業營收賬款查詢,傳統流程需要審核上千份文件,引入智能審單模型后可提升150%以上效率。

      未來,Gamma Lab團隊計劃將現有技術進一步應用于現有模型的迭代升級及更多業務場景拓展,用最先進的技術賦能金融行業。

      Gamma Lab作為金融壹賬通旗下人工智能研究院,致力于推動大數據、人工智能等前沿技術在金融領域的深度應用。Gamma Lab擁有眾多人工智能、大數據專家,累計申請專利技術200多項,前后獲得近十項世界競賽冠軍。Gamma Lab 的迅速崛起離不開金融壹賬通對科技人才、科技研發的持續投入。當前,金融壹賬通研發技術人才就占46%,吸納了眾多來自牛津、清華、北大、復旦、上海交大等全球名校的人才不斷加入。未來,金融壹賬通將憑借靈活多樣的產品矩陣和科技服務能力,為客戶創造更多的價值,把“科技讓金融更簡單”落到實處。

      轉自:福建都市網


      【版權及免責聲明】凡本網所屬版權作品,轉載時須獲得授權并注明來源“中國產業經濟信息網”,違者本網將保留追究其相關法律責任的權力。凡轉載文章及企業宣傳資訊,僅代表作者個人觀點,不代表本網觀點和立場。版權事宜請聯系:010-65363056。

    延伸閱讀

    ?

    版權所有:中國產業經濟信息網京ICP備11041399號-2京公網安備11010502035964

    www.色五月.com