在日常生活中,我們常常會遇到PDF格式的文檔資料。從網(wǎng)上下載的PDF文件中,有些可以正常復制內(nèi)容,但有些因為經(jīng)過轉曲處理(文字被轉換成圖片形式),導致無法直接復制,或者復制后只能得到圖片。對于文字較多的PDF文檔,手動重新輸入非常耗時。此時,我們需要借助識別工具來解決問題。下面將介紹漢王PDF OCR的具體使用方法。

1、 首先,打開已安裝的漢王PDF OCR軟件,所示。

打開網(wǎng)易新聞 查看精彩圖片

2、 依次點擊文件→圖像(或按快捷鍵Ctrl+O),操作所示。

打開網(wǎng)易新聞 查看精彩圖片

3、 在彈出的打開圖像文件窗口中,直接選擇PDF文件,下方的pdf轉換為TXT文件選項會從灰色變?yōu)楹谏?,表示可操作。點擊后即可導出txt文件。注意,此方法適用于高質量的PDF文件,若文件質量較差,直接使用可能會導致較高誤差。

打開網(wǎng)易新聞 查看精彩圖片
打開網(wǎng)易新聞 查看精彩圖片

4、 如果PDF文件質量較差,直接選中文件后點擊打開,參照下圖操作:

打開網(wǎng)易新聞 查看精彩圖片

5、 若PDF為多頁,會彈出選擇拆分多頁PDF窗口,選取所需復制文字的頁碼(也可全選),點擊確定,。

打開網(wǎng)易新聞 查看精彩圖片

6、 打開后,文件欄會顯示該文件,下方框內(nèi)呈現(xiàn)PDF頁面詳情,所示。

打開網(wǎng)易新聞 查看精彩圖片

7、 選中需要轉換的PDF文件頁(或全選),點擊工具欄識別-開始識別(或按F8),。

打開網(wǎng)易新聞 查看精彩圖片

8、 當前,界面上方會顯示正在識別的提示,識別結束后,結果顯示在相同位置。如果PDF文件清晰度不足,可能會出現(xiàn)部分錯誤,可手動修改,效果:

打開網(wǎng)易新聞 查看精彩圖片

9、 在界面頂部的識別結果框中,選中所需文字,右擊鼠標選擇復制,即可粘貼使用,示。

打開網(wǎng)易新聞 查看精彩圖片