Umi-OCR文字識別工具電腦多語言版是一款便捷高效的功能強大免費的OCR軟件,適用于Windows操作平臺,還有批量識別的圖片,支持用戶精準高效的進行文字的識別,可以將文字識別后導出成為不同的文件格式,擁有多個字符識別庫,滿足用戶的使用需求,無需網絡就可以進行文字識別啦,感興趣的用戶快來下載體驗吧~

Umi-OCR文字識別工具電腦多語言版使用說明
快速開始
打開主程序,將任意 圖片/文件夾 拖入窗口中的白色背景表格區域,或點擊左上方的 瀏覽 選擇圖片。
若拖入文件夾,則加載文件夾下所有 符合后綴(見后) 的圖片文件。
點擊右上方 開始任務 ,等待進度條走完。
任務進行中,可隨時點擊 終止任務(原開始任務按鈕)來停止,但下次開始時依然會從頭開始。
點擊 識別內容 選項卡查看輸出文字,或者前往 第一張圖片的目錄 查看識別結果txt文件。
識別內容選項卡中,可一鍵將全部文本 復制到剪貼板 。
基礎設置
點擊 設置 選項卡,配置參數。大部分設置項(除去輸出目錄、文件名,忽略區域參數)會自動保存,下次打開還是這個樣。
忽略圖片中某些區域內的文字:
點擊 添加區域 展開配置忽略區的新窗口。具體配置方式見后。
點擊 清空區域 清空已配置的所有忽略區域參數。
已添加區域后,上方標題文字提示當前忽略區域的 生效分辨率 。
輸出設置:
將 識別內容寫入本地文件 取消勾選后,不會再生成本地文件,只能在 識別內容 選項卡中查看輸出信息。
輸出調試信息 若勾選,則會額外輸出程序工作狀態的內容。
忽略無文字的圖片 若勾選,則不含文字(或文字全被忽略區域屏蔽掉)的圖片名稱不會出現在輸出信息中。
若想生成一份用于瀏覽的markdown文件,則建議取消勾選。
v1.2版本新功能 生成文件可選擇兩種風格:純文本.txt文件 和 Markdown風格.md文件 。前者可用于查找等一般用途。后者在編輯器或瀏覽器中渲染為圖文并茂的頁面,可用于瀏覽和欣賞圖集。
v1.2.2版本新功能 可勾選任務完成后用系統默認編輯器打開輸出文件或輸出文件夾(不生成本地文件時無效)。
輸出目錄 和 輸出文件名 設置生成的文件的位置和名稱。
當拖入第一張圖片且這兩項設置為空時,自動設置輸出路徑為第一張圖片的父目錄,輸出文件名為 [轉文字]_{父目錄}.txt。除非要自定目錄和名稱,否則這兩項默認留空即可。
軟件 處理列表 標簽頁的 清空表格 按鈕,除了會清空已導入的圖片列表,還會清空 輸出目錄 和 輸出文件名 設置。這樣下次拖入新圖片時,就能在新的位置存放輸出文件。
識別器設置:
識別器路徑 配置當前使用的識別器exe程序。
圖片后綴 配置軟件允許載入的圖片后綴,不同后綴以空格分隔,必須全為小寫。
正常情況下無需改動。
忽略區域功能
忽略區域是本軟件特色功能。可用于批量識別視頻截圖時排除右上角水印的干擾,批量識別游戲截圖時排除UI與按鈕的干擾,讓識別結果只留下干凈的臺詞文本。
“忽略區域”是指圖片上指定位置與大小的矩形區域,完全處于這些區域內的文字塊,將被排除。
點擊 設置 選項卡中的 添加忽略區域 ,進入忽略區域選擇窗口。
將任意圖片 拖入 該窗口,可預覽該圖片。將新圖片拖入窗口可切換預覽,但已繪制的忽略區域不會消失;可切換不同圖片來仔細調整忽略區域。
繪制 忽略區域 :拖入圖片后,點擊選中左起第一按鈕 +忽略區域 1 ,然后在圖片上按住左鍵拖拽,繪制矩形區域。可 撤銷 步驟。
繪制完后,點擊 完成 返回軟件主窗口。若不想應用此次繪制,則右上角X,取消。

簡單案例見下。
簡單排除視頻截圖中的水印:
打開忽略區域設置窗口,拖入任一張截圖。 稍等約1秒,面板上會顯示出圖片,識別到的文字區域會被虛線框起來。發現右上角的水印也被識別到了。
點擊選擇 +忽略區域 1 ,鼠標按住,繪制矩形完全包裹住水印區域,范圍可以大一些。
點擊 完成 。返回主窗口, 開始任務 。
排除游戲截圖中的兩種UI:
假設有一組游戲截圖,主要分為兩類圖片,這兩類圖片的文字位置和UI位置不太相同:
A類(上圖左)為對話模式,字數少,要保留的臺詞文本在畫面下方,要排除的UI分布于底端。
B類(上圖右)為歷史文本模式,字數多,從上到下都有要保留的文本(與A類UI位置有重合),要排除的UI分布在兩側。
拖入一張A類圖片。選擇 +忽略區域 1 ,繪制矩形包裹住要排除的 底端UI 。
拖入一張B類圖片。選擇 +識別區域 ,繪制矩形包裹住 小部分要保留的文本 。注意只要該區域內含有任意保留文本即可,不需要畫得很大,不需要包裹住所有保留文本;不能與A類圖中 可能存在的任何文本 重合。
然后選擇 +忽略區域 2 ,繪制矩形包裹住B類圖要排除的 兩側UI 。
點擊 完成 。返回主窗口, 開始任務 。
Umi-OCR文字識別工具電腦多語言版功能
批量識別:支持批量導入處理圖片,可以同時處理多張圖片,提高處理效率。
忽略指定區域:具有特殊功能,可以屏蔽視頻右上角水印、游戲UI等指定區域的內容,提升識別準確性。
多種導出格式:支持將識別結果保存為本地的txt、md、jsonl等多種格式文件,方便后續處理和應用。
即時截屏識別:提供即時截屏功能,可以快速識別屏幕上的文字內容,方便實時應用。
多語言支持:軟件本體含有簡體中文和英文識別庫,并可以根據需求導入繁中、日、韓、俄、德、法等多國語言識別庫,滿足不同語言的識別需求。

Umi-OCR文字識別工具電腦多語言版亮點
UMI-OCR最新版支持水印設置
1.點擊設置選項,在點擊添加忽略區域,就會打開新窗口。
2.將帶有水印的圖片拖入到窗口。
3.窗口當中會顯示圖片,虛線所框出的區域是軟件識別到的文字區域,如果你不想它被識別出來,那么點擊忽略區域并框起來即可。
4.點擊完成然后回到主窗口,然后正常的開始任務即可。
特點
免費開源:Umi-OCR是完全開源的項目,所有代碼開源,用戶可以免費使用并自由修改。
離線運行:無需網絡連接,Umi-OCR可以在離線環境下運行,保護用戶隱私并提供便捷的OCR體驗。
高效快速:采用PaddleOCR-json C++識別引擎,通過充分利用計算機性能,通常比在線OCR服務更快速高效。
精準識別:默認使用PPOCR-v3模型庫,能夠準確辨認常規文字,并在手寫、方向不正、雜亂背景等情景下具有良好的識別率。
后處理功能:可設置忽略區域排除水印,通過設置文塊后處理合并排版段落,生成規整的文本結果。