La reconnaissance de caractères / OCR consiste, à partir d'un document image contenant des caractères, à obtenir un document où le texte (lettres, chiffres…) devient du texte que l'on peut travailler : correction, copie… Pour réaliser cette opération, nous pouvons utiliser un logiciel. Nous vous proposons ici l'utilisation d'un service, gratuit, en ligne : Free Online OCR.
Ce service est simple d'emploi, nous choisissons un document JPG/JPEG, GIF, TIFF ou BMP que nous téléchargeons (upload). Nos devons alors recopier un captcha / code puis cliquer sur 'Recognize'. Nous sélectionnons ensuite une langue au sein d'un menu déroulant. Nous indiquons le type de document désiré parmi plusieurs formats : TXT, DOX, XLS.
Une fenêtre nous prévisualise le résultat des caractères qui ont été reconnu par ce service. Nous cliquons ensuite, plus bas, sur 'Download output file' pour rapatrier le document.
Soyons clair, comme pour tout automatisme, le résultat est parfois acceptable; mais aussi parfois perfectible. Ceci-dit, en mettant toutes les chances de son coté : texte horizontal (et non incliné) sur le fichier image, bon contraste des caractères par rapport au fond… le résultat peut alors s'en ressentir. Une vérification orthographique puis une relecture du document obtenu est toujours une bonne idée.
Chaque document soumis à Free Online OCR, service gratuit, doit avoir un volume de quatre méga-octets au maximum (un original au format JPG est ainsi souvent stratégiquement mieux adapté à cette première limite). En outre, une limite -acceptable- de quinze documents maximum par heure existe.
http://www.onlineocr.net
Lionel
