[gull] OCR

Yann Forget yann at forget-me.net
Tue Nov 28 20:43:47 CET 2006


Bonjour,

Pierre Keller - BCU Lausanne wrote:
> Bonjour à tous,
> 
> Il y a eu quelques échanges sur cette liste sur des logiciels d'OCR,
> il y a quelques années (la dernière fois en 2003, si je peux me fier
> à l'outil de recherche), mais rien de récent. Or c'est tout de même
> un domaine où les choses bougent assez vite.
> 
> Y en a-t-il parmi vous qui utilisent de tels logiciels ? Quelles
> sont vos expériences ?

À ma connaissance, le seul logiciel libre d'OCR digne de ce nom est
Tesseract de Google[1]. C'est en ligne de commande, donc parfaitement
scriptable, mais il ne fonctionne que pour l'anglais. Voir [3] pour un
aperçu du résultat avec un original qui est de mauvaise qualité[4]. J'ai
également essayé gocr et clara, mais le résultat est vraiment décevant.

Il existe une version de Finereader (à mon avis, le meilleur du marché,
mais bien sûr pas libre) pour une utilisation serveur pour Linux[2],
mais je n'ai pas réussi à obtenir la version de démo dont parle le site.

Enfin, j'ai essayé d'installer la version Windows de Finereader (7 & 8)
avec Wine, mais sans succès.

> L'idée que j'ai derrière la tête est de passer au scanner un lot
> d'articles publiés dans différentes revues tout au long des dernières
> décennies, principalement en français, allemand et anglais, et de les
> passer par une moulinette OCR afin de les publier sur le Web.
> 
> Il s'agit donc de tenir compte de différentes fontes et de différentes
> langues d'origine (correction orthographique pour améliorer le taux
> de reconnaissance !)
> 
> Est-il possible de créer une chaîne de production complète sous Linux ?
> 
> Je me réjouis d'entendre vos avis !

Je suis également très intéressé par tous les essais dans ce domaine.

Cordialement,

Yann

[1] http://sourceforge.net/projects/tesseract-ocr
[2] http://www.abbyy.com/sdk/?param=28804
[3] http://en.wikisource.org/wiki/Brundtland_Report
[4]
http://www.are.admin.ch/are/en/nachhaltig/international_uno/unterseite02330/

-- 
http://www.non-violence.org/ | Site collaboratif sur la non-violence
http://www.forget-me.net/ | Alternatives sur le Net
http://fr.wikipedia.org/ | Encyclopédie libre
http://fr.wikisource.org/ | Bibliothèque libre
http://wikilivres.info | Documents libres



More information about the gull mailing list