中國擔保雜志(zhì)官微2024年5月6日
“享核”大(dà)模型——标準合同,智能生(shēng)産
在數(shù)字化轉型的浪潮中,合同審核正經曆着一場(chǎng)智能化的革新。早在2015年,北京國資公司所屬北京再擔保公司就已經實現對于90%以上(shàng)合同內(nèi)容的線上(shàng)生(shēng)成。而随着自然語言處理(lǐ)(NLP)技(jì)術(shù)、遷移學習以及通(tōng)用信息抽取(UIE)模型的不斷發展,北京再擔保公司乘金融科技(jì)之風,近期上(shàng)線“享核”大(dà)模型,破繭融資擔保行(xíng)業合同智能審核之路。
行(xíng)業痛點
随着擔保機構批量化産品、小(xiǎo)微擔保産品快速上(shàng)量,業務合同量也随之增加,業務人(rén)員及法務人(rén)員需要處理(lǐ)大(dà)量的委托保證合同、反擔保合同等業務合同。
①合同人(rén)工填寫及審核效率低(dī):合同信息、業務數(shù)據通(tōng)常分散在不同的文件或系統內(nèi),難以實現有(yǒu)效地整合和(hé)調用。傳統合同制(zhì)作(zuò)及審核方式免除不了信息的人(rén)工輸入,合同填制(zhì)及審核效率已無法滿足快速增長的合同審核需求。
②錯誤和(hé)疏漏:合同人(rén)工填制(zhì)及審核過程中可(kě)能出現的疏漏和(hé)錯誤經常導緻大(dà)量重複性工作(zuò),也會(huì)增加法律和(hé)财務風險。
③合規性風險:合同內(nèi)容的合規性審核要求審核人(rén)員具備一定的專業能力,對于新入行(xíng)的法務人(rén)員來(lái)說,很(hěn)難全面掌握法規知識。
解決方案
為(wèi)解決融資擔保行(xíng)業前端業務批量化後,後端合同填制(zhì)和(hé)審核難題,北京再擔保公司推出“享核”大(dà)模型,結合NLP、OCR等技(jì)術(shù),總結擔保行(xíng)業中制(zhì)式合同的審核規則,在大(dà)語言模型基礎上(shàng)用行(xíng)業垂直語料進行(xíng)預訓練,全面實現标準合同自動審核的功能。目前我們已經就北京轄內(nèi)中國銀行(xíng)、交通(tōng)銀行(xíng)、南京銀行(xíng)、招商銀行(xíng)等主要開(kāi)展小(xiǎo)微業務銀行(xíng)的合同進行(xíng)模型訓練,實現了合同100%智能提取,無需人(rén)工填充合同。
第一步 業務人(rén)員上(shàng)傳主合同、保證合同、決議等文件
第二步 業務人(rén)員選擇合同類型并構建合同
第三步 系統智能生(shēng)成及輔助審核
應用技(jì)術(shù)
①自然語言處理(lǐ)(NLP)技(jì)術(shù):利用NLP技(jì)術(shù),智能審核系統可(kě)以理(lǐ)解合同中的自然語言文本,實現深入分析,讓機器(qì)像專業人(rén)員一樣理(lǐ)解和(hé)處理(lǐ)合同文本。
②遷移學習:遷移學習技(jì)術(shù)使模型能夠快速适應新的審核場(chǎng)景,即使在數(shù)據量較少(shǎo)的情況下也能保持高(gāo)準确度。
③UIE模型:能夠從文本中抽取任意命名的實體(tǐ)和(hé)關系,極大(dà)提升了從合同文本中抽取關鍵信息的能力。
④深度學習和(hé)知識圖譜:結合深度學習和(hé)知識圖譜,識别合同中的關鍵信息。
⑤自動化和(hé)智能化:自動化執行(xíng)合同審核要點,減少(shǎo)人(rén)工幹預,提高(gāo)審核效率和(hé)準确性。
專業優勢
一方面,利用大(dà)模型通(tōng)用能力,基于北京再擔保公司已積累的融資擔保行(xíng)業業務數(shù)據對大(dà)模型進行(xíng)定向微調,打造可(kě)擴展、可(kě)遷移的大(dà)模型智能合同審查方案。另一方面,基于大(dà)量已成型的融資擔保行(xíng)業業務實操數(shù)據清洗工作(zuò),訓練面向特定審查需求的算(suàn)法任務,并通(tōng)過明(míng)确代碼承接業務邏輯,實現高(gāo)準确性的行(xíng)業垂類小(xiǎo)模型審查反饋。
集北京再擔保公司業務、風控、法務與技(jì)術(shù)專業資源,從數(shù)據、理(lǐ)論、知識、實務等多(duō)維度,打造最符合融資擔保行(xíng)業特點的“數(shù)據+業務+模型”合同智能審核工具,基本覆蓋再擔保、直保融資及保函涉及的全部合同類型。
實施效果
①效率提升、釋放人(rén)力:通(tōng)過輔助審核,系統可(kě)快速處理(lǐ)大(dà)量合同文檔,減少(shǎo)了對人(rén)工審核的依賴,提升效率的同時(shí)釋放了公司專業法律人(rén)員的人(rén)力。
②風險識别:通(tōng)過深度學習和(hé)訓練,識别合同中的潛在法律風險和(hé)漏洞。
③多(duō)模态數(shù)據集成:将分散于不同業務系統不同形态的數(shù)據集中訓練,為(wèi)合同智能審核提供便捷的數(shù)據訪問和(hé)分析能力,有(yǒu)效打破信息孤島,實現數(shù)據的無縫共享與利用。
④準确性提高(gāo):利用先進的算(suàn)法和(hé)大(dà)數(shù)據分析,智能審核系統提供更為(wèi)準确的審核結果。
未來(lái),“享核”大(dà)模型還(hái)能應用在行(xíng)業監管、行(xíng)政審批等多(duō)個(gè)細分場(chǎng)景。
傾力打造的融資擔保行(xíng)業“大(dà)模型”——再享大(dà)模型,專注解決行(xíng)業難點和(hé)痛點, 持續提升融資擔保行(xíng)業智能化水(shuǐ)平,我們一直在路上(shàng)。
來(lái)源:北京再擔保(夏烨)