OCR: Difference between revisions

OCR (edit)

3 bytes added , 20 April 2022

m

no edit summary

Anonymous user

@@ Line 31: / Line 31: @@
 : [[Image:Owl icon.jpg]] 講個秘訣：因為線上服務免費版會限制 PDF 檔案頁數，可使用切割軟體 [[PDF split and merge tools]]
-== OCR scripts or OCR API ==
+== OCR scripts ==
 Scripts
 * PHP: [https://github.com/thiagoalessio/tesseract-ocr-for-php thiagoalessio/tesseract-ocr-for-php: A wrapper to work with Tesseract OCR inside PHP.] 有提供繁體中文 model 檔案({{kbd | key=chi_tra (Chinese traditional)}}) <ref>[https://github.com/tesseract-ocr/tesseract/blob/main/doc/tesseract.1.asc#languages-and-scripts LANGUAGES AND SCRIPTS]</ref>，但是繁體中文辨識結果不佳。{{access | date=2022-04-20}}
 * Python: [https://github.com/ocropus/ocropy ocropus/ocropy: Python-based tools for document analysis and OCR] 沒有提供中文 model 檔案 {{access | date=2022-04-20}}
+== OCR API ==
 OCR API
 * [https://azure.microsoft.com/zh-tw/services/cognitive-services/computer-vision/ 電腦視覺 | Microsoft Azure]: [https://docs.microsoft.com/zh-tw/azure/cognitive-services/Computer-vision/quickstarts-sdk/client-library?pivots=programming-language-rest-api&tabs=visual-studio 快速入門：光學字元辨識 (OCR) 用戶端程式庫或 REST API - Azure Cognitive Services | Microsoft Docs] 支援中文<ref>[https://docs.microsoft.com/zh-tw/azure/cognitive-services/computer-vision/language-support#optical-character-recognition-ocr 語言支援 - 電腦視覺 - Azure Cognitive Services | Microsoft Docs]</ref>