[gull] OCR

Daniel Cordey dc at mjt.ch
Tue Nov 28 17:34:25 CET 2006


On Tuesday 28 November 2006 17:21, Pierre Keller - BCU Lausanne wrote:

> Il s'agit donc de tenir compte de différentes fontes et de différentes
> langues d'origine (correction orthographique pour améliorer le taux
> de reconnaissance !)

J'ai utilise quelque fois 'ocra', mais je sais qu'il existe aussi un outil 
GNU. Mon experience est mitigee... C'est a utiliser avec un correcteur 
orthographique qui pointera tous les mots avec des accents, des apostrophes, 
cedilles, etc. J'imagine que le probleme est le meme en allemand avec les 
umlaut, etc. Il y a quand meme pas mal de travail manuel a effectuer, mais de 
tres loin rien de comparable par rapport a entrer le texte a la main ! Ca 
vaut la peine, mais, en l'etat de mes connaissances, difficile a automatiser 
completement.

Mais je serais content d'apprendre qu'il existe de nouvelles techniques ou de 
nouveaux outils dans ce domaine.

dc



More information about the gull mailing list