Программно распознавать текст из сканов в файле PDF
Вы не можете извлечь отсканированный ocr текст из PDF. Вам нужно программное pdf обеспечение OCR. Хорошей pdf новостью является то, что pdf есть несколько приложений pdf с открытым исходным кодом, которые pdf вы можете попробовать, и ocr маршрут OCR, скорее всего, будет ocr проще, чем использование ocr библиотеки PDF для извлечения ocr текста. Проверьте Tesseract pdf и GOCR.
ocr
Программно распознавать текст из сканов в файле PDF
Мы используем файлы cookies для улучшения работы сайта. Оставаясь на нашем сайте, вы соглашаетесь с условиями использования файлов cookies. Чтобы ознакомиться с нашими Положениями о конфиденциальности и об использовании файлов cookie, нажмите здесь.