在信創(chuàng)背景下,金融機(jī)構(gòu)系統(tǒng)遷移面臨一個(gè)現(xiàn)實(shí),底層硬件體系多樣化,例如C86+DCU、ARM+昇騰等。如果上層應(yīng)用軟件(如核心業(yè)務(wù)系統(tǒng)中的OCR識(shí)別引擎)每次適配一種新硬件,就需要開(kāi)發(fā)和維護(hù)一個(gè)獨(dú)立的軟件版本。
這會(huì)直接導(dǎo)致以下問(wèn)題:
●開(kāi)發(fā)成本激增: 每適配一種硬件組合,都意味著一次獨(dú)立的開(kāi)發(fā)、測(cè)試和部署流程。
●運(yùn)維成本失控: 運(yùn)維團(tuán)隊(duì)需要同時(shí)維護(hù)多個(gè)軟件版本,版本管理混亂,排查問(wèn)題異常困難,人力成本和系統(tǒng)風(fēng)險(xiǎn)上升。
●投資無(wú)法延續(xù): 當(dāng)?shù)讓佑布俅紊?jí)換代時(shí),之前的軟件投資很可能作廢,需要推倒重來(lái),造成資源浪費(fèi)。
一個(gè)原生適配、統(tǒng)一架構(gòu)的平臺(tái)是解決上述問(wèn)題的關(guān)鍵。例如易道博識(shí)的智能文檔處理平臺(tái)(簡(jiǎn)稱DeepIDP),它的核心價(jià)值在于,從軟件底層就完成了對(duì)所有主流國(guó)產(chǎn)化硬件的適配。
1. 如何降低維護(hù)成本?
僅需一套軟件版本: 運(yùn)維團(tuán)隊(duì)只需要面對(duì)一個(gè)統(tǒng)一的軟件架構(gòu)。無(wú)論底層是哪種國(guó)產(chǎn)芯片或服務(wù)器,上層的AI能力和應(yīng)用都是一致的,告別版本混亂。例如, 某銀行的核心系統(tǒng)同時(shí)在ARM和C86兩種架構(gòu)的服務(wù)器上運(yùn)行。通過(guò)統(tǒng)一平臺(tái),他們部署的是同一套DeepIDP軟件,開(kāi)發(fā)和運(yùn)維團(tuán)隊(duì)無(wú)需再為不同架構(gòu)維護(hù)兩套代碼,人力成本降低了至少50%。
2. 如何保障投資的連續(xù)性?
平滑遷移: 統(tǒng)一架構(gòu)確保了AI能力的投資是可延續(xù)、可擴(kuò)展的。未來(lái)即使信創(chuàng)硬件再次迭代,上層的智能應(yīng)用也無(wú)需重構(gòu),可以平滑遷移,保護(hù)了前期的IT投資。
金融業(yè)務(wù)涉及的文檔類(lèi)型極其復(fù)雜,從版式固定的身份證、發(fā)票,到版式千變?nèi)f化的業(yè)務(wù)申請(qǐng)單、對(duì)賬單。單一模型難以勝任所有場(chǎng)景。
一個(gè)常見(jiàn)的誤區(qū)是認(rèn)為一個(gè)強(qiáng)大的大模型就能解決所有問(wèn)題。 實(shí)際上,最高效的策略是“大小模型協(xié)同”。
●專用小模型:處理高頻、標(biāo)準(zhǔn)文檔
任務(wù): 識(shí)別身份證、銀行卡、發(fā)票、車(chē)票等版式固定的文檔。
優(yōu)勢(shì): 速度極快、精度極高、資源占用小,最適合處理業(yè)務(wù)流程中出現(xiàn)頻率最高的標(biāo)準(zhǔn)化單據(jù)。
●大模型:處理非標(biāo)、長(zhǎng)尾文檔
任務(wù): 識(shí)別各類(lèi)申請(qǐng)單、合同、對(duì)賬單、醫(yī)療單據(jù)等版式不固定、字段靈活的復(fù)雜文檔。
優(yōu)勢(shì):
■靈活抽取: 僅需通過(guò)提示詞(Prompt)告知模型需要抽取的字段(如“抽取合同中的甲方和簽約日期”),即可從任意版式中提取信息。
■金融領(lǐng)域優(yōu)化: 經(jīng)過(guò)金融行業(yè)數(shù)據(jù)二次訓(xùn)練的大模型,能更精準(zhǔn)地理解復(fù)雜表格和上下文,抽取精度更高。
■數(shù)據(jù)可溯源: 這是保障業(yè)務(wù)可信度的關(guān)鍵。平臺(tái)能將抽取的每一個(gè)字段(如JSON結(jié)果中的一個(gè)數(shù)值)精確關(guān)聯(lián)回原始影像的具體坐標(biāo)位置,方便人工核驗(yàn)和審計(jì)。
僅僅提取出數(shù)據(jù)是不夠的,核心是要讓AI能力融入業(yè)務(wù),實(shí)現(xiàn)端到端的自動(dòng)化。
1. 如何讓AI智能體(Agent)按需調(diào)用? 易道博識(shí)智能文檔處理平臺(tái)提供一系列“AI原子能力”(如文檔分割、分類(lèi)、各類(lèi)識(shí)別模型等),讓智能體可以像調(diào)用工具一樣靈活使用。
例如:財(cái)務(wù)報(bào)銷(xiāo)審核Agent
○分割與分類(lèi): Agent首先調(diào)用“圖像分割”與“文檔分類(lèi)”能力,將一疊報(bào)銷(xiāo)單據(jù)自動(dòng)拆分,并識(shí)別出哪些是發(fā)票,哪些是報(bào)銷(xiāo)申請(qǐng)單。
○分發(fā)與抽取: 接著,Agent將發(fā)票分發(fā)給“小模型”快速提取金額、日期;將報(bào)銷(xiāo)申請(qǐng)單分發(fā)給“大模型”抽取報(bào)銷(xiāo)事由、部門(mén)等信息。
○推理與決策: 最后,Agent利用大模型的推理能力,結(jié)合企業(yè)財(cái)務(wù)規(guī)則(如報(bào)銷(xiāo)金額是否超標(biāo)),自動(dòng)輸出“審核通過(guò)”或“駁回”的結(jié)論。
問(wèn)題1:這套OCR識(shí)別系統(tǒng)支持哪些具體的國(guó)產(chǎn)硬件和操作系統(tǒng)?
回答: 易道博識(shí)智能文檔處理平臺(tái)從底層架構(gòu)原生適配主流國(guó)產(chǎn)化硬件,全面兼容C86+DCU、ARM+昇騰等多種信創(chuàng)體系,并支持麒麟、統(tǒng)信等國(guó)產(chǎn)操作系統(tǒng)。其核心優(yōu)勢(shì)在于,無(wú)論底層硬件如何組合,提供給上層應(yīng)用的都是統(tǒng)一、穩(wěn)定的服務(wù)接口。
問(wèn)題2:大模型處理金融行業(yè)復(fù)雜表格的精度如何?
回答: 精度主要通過(guò)兩方面保證:首先,智能文檔處理平臺(tái)選用的大模型是經(jīng)過(guò)海量金融行業(yè)特有文檔(如復(fù)雜對(duì)賬單、年報(bào)、招股書(shū)等)進(jìn)行二次訓(xùn)練和微調(diào)的,使其能更深刻地理解金融領(lǐng)域的上下文和版式。其次,其強(qiáng)大的溯源能力可以將每個(gè)抽取結(jié)果精準(zhǔn)定位回原文,極大地方便了人工核驗(yàn),形成了一個(gè)“AI處理+人工校驗(yàn)”的質(zhì)量閉環(huán)。