從PDF中提取文本和圖像的初學者指南

學習多種方法從PDF文件中提取圖像和文本

PDF文件非常適合跨平台交換格式化文件,也適用於不使用相同軟件的人群,但有時我們需要從PDF文件中提取文本或圖像,並將其用於網頁, 文字處理文檔 ,PowerPoint演示文稿或在桌面出版軟件中

根據您的需求和個人PDF中設置的安全選項,您可以通過多種方式從PDF文件中提取文本,圖像或兩者。 選擇最適合您的選項。

使用Adobe Acrobat從PDF文件中提取圖像和文本

如果您擁有Adobe Acrobat的完整版本,而不是免費的Acrobat Reader,則可以從PDF中提取單個圖像或所有圖像以及文本,並以各種格式(如EPS,JPG和TIFF)導出。 要從Acrobat DC中的PDF中提取信息,請選擇“ 工具” >“ 導出PDF”並選擇一個選項。 要提取文本,請將PDF導出為Word格式或富文本格式,並從以下幾個選項中進行選擇:

使用Acrobat Reader從PDF複製和粘貼

如果您擁有Acrobat Reader,則可以將一部分PDF文件複製到剪貼板並將其粘貼到另一個程序中。 對於文本,只需突出顯示PDF中的文本部分,然後按Control + C進行複制即可。

然後打開文字處理程序,例如Microsoft Word ,然後按Control + V粘貼文本。 使用圖像時,單擊圖像將其選中,然後使用相同的鍵盤命令將其複制並粘貼到支持圖像的程序中。

在圖形程序中打開PDF文件

當圖像提取是您的目標時,您可以在一些插圖程序中打開PDF ,例如較新版本的Photoshop ,CorelDRAW或Adobe Illustrator,並保存圖像以供在桌面出版應用程序中編輯和使用。

使用第三方PDF提取軟件工具

有幾個獨立的實用程序和插件可用於將PDF文件轉換為HTML,同時保留頁面佈局,將PDF內容提取並轉換為矢量圖形格式,並提取PDF內容以用於文字處理,演示文稿和桌面出版軟件。 這些工具提供了多種選項,包括批量提取/轉換,整個文件或部分內容提取,以及多種文件格式支持。這些工具主要是商業和共享軟件基於Windows的實用程序。

使用在線PDF提取工具

使用在線提取工具,您不必下載或安裝軟件。 每個人可以提取的數量各不相同。 例如,通過ExtractPDF.com,您可以上傳大小不超過14MB的文件,或者提供PDF的URL以提取圖像,文本或字體。

截圖

在使用PDF格式截取圖像之前,請盡可能在屏幕上將其放大。 在PC上,單擊PDF窗口的標題欄並按Alt + PrtScn 。 在Mac上,單擊Command + Shift + 4並使用出現的光標拖動並選擇要捕獲的區域。