光學字符識別(OCR)是指創建計算機無需手動輸入或輸入文本即可閱讀的打印,打印或手寫文檔的數字版本的軟件。 OCR通常用於PDF格式的掃描文檔,但也可以在圖像文件中創建計算機可讀版本的文本。
什麼是OCR?
OCR也稱為文本識別,是一種軟件技術,可將數字,字母和標點(也稱為字形)等字符從打印或書寫文檔轉換為電子表格,更容易被計算機和其他軟件程序識別和讀取。 一些OCR程序會在數碼相機掃描或拍攝文檔時執行此操作,而其他OCR程序可將此過程應用於先前已掃描或未使用OCR進行拍攝的文檔。 OCR允許用戶在PDF文檔中搜索,編輯文本和重新格式化文檔。
什麼是OCR用於?
為了快速,每天都需要掃描,OCR可能不是什麼大問題。 如果您進行大量掃描,能夠在PDF中進行搜索以找到所需的確切文件可以節省相當多的時間,並使掃描程序中的OCR功能更為重要。 以下是OCR幫助的其他一些事情:
- 自動數據處理和數據輸入(例如:求職者追踪系統的簡歷)
- 使掃描書籍可搜索
- 將手寫掃描轉換為計算機可讀文本
- 通過幫助視障用戶的讀者程序使文檔更加可用
- 保存歷史文件和報紙,同時也使它們可以搜索
- 數據提取和轉入會計計劃(例如:收據和發票)
- 索引文件以供搜索引擎使用
- 通過高速攝像頭和紅燈攝像頭軟件識別駕駛員車牌
- 無法說話的人的語音合成器 - 理論物理學家斯蒂芬霍金也許是語音合成器程序中最知名的用戶
為什麼使用OCR?
為什麼不拍一張照片,對吧? 因為你將無法編輯任何內容或搜索文本,因為它只是一個圖像。 掃描文檔並運行OCR軟件可以將該文件轉換為您可以編輯並能夠搜索的文件。
OCR的歷史
雖然最早使用文本識別可以追溯到1914年,但OCR相關技術的廣泛開發和使用始於20世紀50年代,特別是創建非常簡單的字體,這些字體更易於轉換為數字可讀文本。 第一種簡化字體由David Shepard創建,俗稱OCR-7B。 OCR-7B今天在金融行業仍然在使用信用卡和借記卡上使用的標準字體。 在20世紀60年代,幾個國家的郵政服務開始使用OCR技術來加速郵件分揀,包括美國,英國,加拿大和德國。 OCR仍然是全球郵政分揀郵件的核心技術。 2000年,OCR技術的限制和能力的關鍵知識被用於開髮用於阻止漫遊器和垃圾郵件發送者的CAPTCHA程序 。
數十年來,由於人工智能 , 機器學習和計算機視覺等相關技術領域的進步,OCR變得更加精確和復雜。 今天,OCR軟件使用模式識別,特徵檢測和文本挖掘功能,可以比以往更快,更準確地轉換文檔。