[gull] wget et les fichiers *.chm

Marc Mongenet Marc.Mongenet at freesurf.ch
Sun May 2 00:31:01 CEST 2004


pierre maitre wrote:
> Bonsoir la liste
> 
> Deux questions:
> 
> 1) je souhaiterais télécharger toute une arborescence depuis un site 
> internet (le tarif médical TARMED  ;-) ,
> http://www.fmh.ch/ww/fr/pub/prestations/tarifs/tarmed/tarmed_browser.htm 
> )  et je n'y arrive pas avec wget, parce que la page de départ est au 
> format   *.chm (le format "help" propriétaire windows) et wget n'arrive 
> pas à suivre l'arborescence puisque ce n'est pas du html.

Le fichier tarif_11r_f.chm fait 3328918 octets, n'est-ce pas l'ensemble
de la documentation ?

 > De plus, wget
> semble ne pas comprendre la syntaxe wget -r http://url/*  (wildcard)
> Quelqu'un saurait-il comment télécharger tout un répertoire depuis un 
> site web, quel que soit le format des fichiers?

Pour être strict, le concept de répertoire est étranger à HTTP,
il est impossible de demander à un serveur Web la liste de ce qui
est accessible sous "http://url/".

sur un site Web, on est obligé de donner à wget l'URL d'un document
HTML. À partir de là, wget peut charger tout ce qui est pointé par les
hyperliens du document. Et il peut recommencer récursivement avec les
hyperliens contenus par les documents qu'il vient de charger.
Voici un exemple, chargeant un document HTML, puis tout ce qu'il
pointe, puis arrêtant la récursion (-l 1).

wget -r -l 1 http://home.infomaniak.ch/mongenet/Marc/


> 2) comment transformer du format *.chm en format *.html. J'ai trouvé sur 
> google un programme chm2html pour windows, payant, et un programme 
> chinois pour free-bsd (que je n'ai pas réussi à faire fonctionner), mais 
> rien d'autre. Quelqu'un aurait-il une information là dessus.

Aucune information, désolé.
Pourquoi ne pas directement consulter le .chm ?
xCHM a l'air joli en captures d'écrans <http://xchm.sourceforge.net/>

Marc Mongenet



More information about the gull mailing list