[gull] OCR
Daniel Cordey
dc at mjt.ch
Tue Nov 28 17:34:25 CET 2006
On Tuesday 28 November 2006 17:21, Pierre Keller - BCU Lausanne wrote:
> Il s'agit donc de tenir compte de différentes fontes et de différentes
> langues d'origine (correction orthographique pour améliorer le taux
> de reconnaissance !)
J'ai utilise quelque fois 'ocra', mais je sais qu'il existe aussi un outil
GNU. Mon experience est mitigee... C'est a utiliser avec un correcteur
orthographique qui pointera tous les mots avec des accents, des apostrophes,
cedilles, etc. J'imagine que le probleme est le meme en allemand avec les
umlaut, etc. Il y a quand meme pas mal de travail manuel a effectuer, mais de
tres loin rien de comparable par rapport a entrer le texte a la main ! Ca
vaut la peine, mais, en l'etat de mes connaissances, difficile a automatiser
completement.
Mais je serais content d'apprendre qu'il existe de nouvelles techniques ou de
nouveaux outils dans ce domaine.
dc
More information about the gull
mailing list