[gull] pdf to spdf (Searchable PDF)

Yann Lehmann aristide at vtxmail.ch
Mon Feb 3 21:06:58 CET 2014


On 02. 02. 14 23:15, Thibault North wrote:
> Hello,
>
> 2014-02-02 Cédric BRINER <briner at infomaniak.ch>:
>> Salut,
>>
>> Je souhaite trouver une solution me permettant de faire une reconnaissance
>> de caractère sur des documents PDF issue d'une numérisation.
>>

Au risque de répondre à côté de la plaque, il me semble que 'pdfocr' 
permet de numériser des documents au format pdf, d'effectuer une 
reconnaissance de caractère, puis de "fusionner" le texte reconnu avec 
le pdf original, pour un faire un pdf indexable:

http://ubuntuforums.org/showthread.php?t=1456756

Il me semblait avoir vu un autre script faisant la même chose, 
malheureusement, je n'arrive pas à retrouver ma note.

Je n'ai pas encore eu l'occasion d'essayer un ou l'autre de ces outils, 
aussi, je ne sais pas ce qu'ils valent.


More information about the gull mailing list