分享一款OCR批量圖片文字識別工具(Umi-OCR),它的主要特點(diǎn)就是可以進(jìn)行離線批量識別,假如你有大批量的文字圖片,那么使用這款工具可以批量識別并寫入到文本中,大大降低了用戶的操作時間,提高了效率。本軟件擁有專門針對視頻截圖和游戲截圖特化的功能:忽略區(qū)域。可以屏蔽掉視頻右上角水印和游戲的UI,輸出干干凈凈的臺詞文本
軟件介紹:
本軟件用于批量導(dǎo)入本地圖片,識別圖片中的文本,輸出到軟件面板或本地txt文件。 除了能
批量識別普通圖片,本軟件還有忽略指定區(qū)域的特殊功能。
類似含水印的視頻截圖、含有UI/按鈕的游戲截圖等,往往只需要提取字幕區(qū)域的文
本,而避免提取到水印和UI文本。本軟件可設(shè)置忽略某些區(qū)域內(nèi)的文字,來實(shí)現(xiàn)這一目
的。尤其是,特別適合用于批量提取Galgame截圖中的臺詞。
當(dāng)有大量的影視和游戲截圖需要整理歸檔,或者想翻找包含某一段臺詞/字幕的截圖;
將這些圖片提取出文字、然后Ctrl+F是一個很有效的方法。這是開發(fā)本軟件的初衷。
本軟件使用離線OCR模塊 PaddleOCR-json 圖片轉(zhuǎn)文字程序 ,使用過程中無需聯(lián)網(wǎng)。支持更
換 Paddle官方模型(v2.x版本)或自己訓(xùn)練的模型,支持修改PaddleOCR參數(shù)。通過添加不
同的語言模型,軟件可識別多國語言。
使用說明:
1、下載壓縮包并解壓,主程序 Umi-OCR 批量圖片轉(zhuǎn)文字.exe 與識別器模塊文件夾 PaddleOCRjson 需置于同一目錄下。
2、打開主程序,將任意 圖片/文件夾 拖入窗口中的白色背景表格區(qū)域,或點(diǎn)擊左上方的 瀏 覽 選擇圖片。 若拖入文件夾,則加載文件夾下所有 符合后綴(見后) 的圖片文件。 2. 點(diǎn)擊右上方 開始任務(wù) ,等待進(jìn)度條走完。 任務(wù)進(jìn)行中,可隨時點(diǎn)擊 終止任務(wù)(原開始任務(wù)按鈕)來停止,但下次開始時依然 會從頭開始。 3. 點(diǎn)擊 識別內(nèi)容 選項(xiàng)卡查看輸出文字,或者前往 第一張圖片的目錄 查看識別結(jié)果txt文 件。 識別內(nèi)容選項(xiàng)卡中,可一鍵將全部文本 復(fù)制到剪貼板 。
關(guān)于設(shè)置和特別功能部分詳情請閱讀使用說明.pdf