使用效果如下圖。直接在會(huì)博通搜索引擎上輸入搜索文字,結(jié)果反饋除了文檔格式之外,還包括PDF等圖片格式。
OCR技術(shù)指的是,對(duì)文本資料的圖像文件,進(jìn)行分析識(shí)別處理,獲取版面信息的過(guò)程。在眾多OCR應(yīng)用當(dāng)中,基于對(duì)識(shí)別準(zhǔn)確率、場(chǎng)景覆蓋面、語(yǔ)種豐富度等因素的考量,會(huì)博通選擇了百度OCR。
在圖片文字識(shí)別上,百度OCR不僅能夠識(shí)別常規(guī)PDF文件,還能識(shí)別存在背景豐富、低亮度、低對(duì)比度、光照不均、透視變形、字號(hào)、字重、顏色不一等多重問(wèn)題的圖片,精準(zhǔn)度可以說(shuō)是非常高的。同時(shí),百度OCR也適用于卡證驗(yàn)核、財(cái)會(huì)報(bào)銷、交通物流、教育培訓(xùn)、內(nèi)容審核等多種文字識(shí)別場(chǎng)景,滿足檔案管理的多種需求。此外,百度OCR還支持英、日、韓、法、德、意等20多種語(yǔ)種,對(duì)于多語(yǔ)言識(shí)別也不在話下。
在配置了OCR功能的會(huì)博通檔案系統(tǒng)當(dāng)中,圖片資料一經(jīng)上傳,系統(tǒng)便會(huì)分配一個(gè)后臺(tái)任務(wù),在系統(tǒng)空閑的時(shí)候,對(duì)文件進(jìn)行識(shí)別成為文本文件。 文本文件識(shí)別完成后,內(nèi)容就會(huì)自動(dòng)接入到會(huì)博通搜索平臺(tái)當(dāng)中,與搜索內(nèi)容進(jìn)行匹配,便于用戶精準(zhǔn)快速獲取包含圖片在內(nèi)的信息。
會(huì)博通檔案管理系統(tǒng),擁有非常強(qiáng)大的檔案搜索功能,提供了包括關(guān)鍵詞檢索、全文檢索、類自然語(yǔ)言檢索、二次搜索等多種檢索方式,并且搜索結(jié)果可依權(quán)限反饋。在這個(gè)基礎(chǔ)之上,在結(jié)合百度ocr功能,可以說(shuō)是非常全面、安全、高效的一套檔案搜索體系了,完全滿足當(dāng)下檔案文件搜索需要。
在會(huì)博通檔案管理軟件當(dāng)中,OCR功能屬于選配組件。如果您的檔案當(dāng)中存在大量的PDF、JPG等圖片資料,為方便后期檢索,我們建議您最好選配OCR功能;如果您對(duì)于檔案全文檢索需求不大,或檔案資料以電子化的文檔為主,那么也可以暫且不配置該功能;如果您的系統(tǒng)安裝沒(méi)有配置OCR功能,但隨著業(yè)務(wù)的發(fā)展,對(duì)于圖片搜索的需求增加,那么也可以隨時(shí)聯(lián)系我們進(jìn)行系統(tǒng)升級(jí)。
推薦閱讀:
致會(huì)博通檔案管理系統(tǒng)用戶:別忘了,你有一個(gè)專屬信息保管箱哦