Tasca #1124
tancatFer opcional l'opció --restrict-file-names=windows,ascii al capturar pàgines web
Descripció
Entre les moltíssimes opcions que dóna el robot wget, n'hi ha una que serveix per a normalitzar els noms de fitxers que poden ser vàlids com a URLs, però no com a fitxers. Això inclou sobretot els valors ? i & de les urls dinàmiques.
L'opció --restrict-file-names dóna diferents opcions per normaltizar els noms dels fitxers capturats, canviant-los per @ i altres caràcters menys problemàtics. Aquesta opció la vaig incloure per a capturar correctament les URLs alguna de les revistes de la Fundació Laporte (concretament RESYM, http://ddd.uab.cat/record/57212).
Ara hem vist que quan aquesta opció està activa no es poden capturar correctament algunes exposicions Web que utilitzen Javascript per a generar efectes de Zoom, com el Scriptaculous.
Per tant, l'opció --restrict-file-names ha de poder activar-se o no depenent de cada cas.
FJ Actualitzat per Ferran Jorba fa quasi 14 anys
- Estat ha canviat de Creada a Tancada
Ja està fet.