Projecte

General

Perfil

Accions

Tasca #1124

tancat
FJ FJ

Fer opcional l'opció --restrict-file-names=windows,ascii al capturar pàgines web

Tasca #1124: Fer opcional l'opció --restrict-file-names=windows,ascii al capturar pàgines web

Afegit per Ferran Jorba fa aproximadament 15 anys. Actualitzat fa quasi 14 anys.

Estat:
Tancada
Prioritat:
Normal
Assignat a:
Categoria:
-
Inici:
Data de venciment:
Paraula clau:

Descripció

Entre les moltíssimes opcions que dóna el robot wget, n'hi ha una que serveix per a normalitzar els noms de fitxers que poden ser vàlids com a URLs, però no com a fitxers. Això inclou sobretot els valors ? i & de les urls dinàmiques.

L'opció --restrict-file-names dóna diferents opcions per normaltizar els noms dels fitxers capturats, canviant-los per @ i altres caràcters menys problemàtics. Aquesta opció la vaig incloure per a capturar correctament les URLs alguna de les revistes de la Fundació Laporte (concretament RESYM, http://ddd.uab.cat/record/57212).

Ara hem vist que quan aquesta opció està activa no es poden capturar correctament algunes exposicions Web que utilitzen Javascript per a generar efectes de Zoom, com el Scriptaculous.

Per tant, l'opció --restrict-file-names ha de poder activar-se o no depenent de cada cas.

FJ Actualitzat per Ferran Jorba fa quasi 14 anys Accions #1

  • Estat ha canviat de Creada a Tancada

Ja està fet.

Accions

També disponible a: PDF Atom