edición general
  1. Me estoy entreteniendo con python y me he topado con una pequeña joya que no conocia , tesserac de google ,un ocr brutal. y con 5 putas lineas de python reconociendo un documento escaneado y pasandolo a texto sin un solo fallo... y de las 5 lineas, 2 son importacion de librerias y una porque me da pereza actualizar el path. y la cuarta y la quinta igual puedo combinarlas.
    import cv2
    import pytesseract
    pytesseract.pytesseract.tesseract_cmd = r'C:/Program Files (x86)/Tesseract-OCR/tesseract'
    img = cv2.imread('scan01.png')
    print(pytesseract.image_to_string(img))

menéame