[gull] OCR

Marc SCHAEFER schaefer at alphanet.ch
Tue Nov 28 20:40:16 CET 2006


On Tue, Nov 28, 2006 at 05:21:00PM +0100, Pierre Keller - BCU Lausanne wrote:
> Y en a-t-il parmi vous qui utilisent de tels logiciels ? Quelles
> sont vos expériences ?

Je fais du traitement automatisé de faxes ainsi que de l'archivage, mais
pas très souvent, et il s'agit surtout de détecter certains mots clés,
qui sont en général en majuscules.

J'utilise soit gocr (sans vraiment tuner quoi que ce soit) pour
l'application automatique, soit clara lorsqu'il s'agit de scannage
manuel.

Dans le cas de clara, le logiciel apprend au fur et à mesure, il n'y a
que peu de corrections à apporter après coup (mais on perd du temps au
début).

Dans tous les cas la première étape est d'aligner l'image, aucun de ces
logiciels ne supportent la lecture en diagonale :->

> Il s'agit donc de tenir compte de différentes fontes et de différentes
> langues d'origine (correction orthographique pour améliorer le taux
> de reconnaissance !)

Pas de correction orthographique intégrée à ces logiciels, à ma
connaissance, effectivement cela pourrait être intéressant lors de la
détection, pas seulement après.

> Est-il possible de créer une chaîne de production complète sous Linux ?

A mon avis, un système automatisé entièrement en logiciels libres
nécessiterait pas mal de développement.




More information about the gull mailing list