Tasca #1138
tancatCorregir els noms de fitxers problemàtics dels documents de Recercat
Descripció
Els noms de fitxers de Recercat sovint tenen diacrítics, parèntesis, espais, claudàtors i altres caràcters problemàtics. Això genera problemes en la generació de les 856 locals i la creació de les miniatures.
Cal trobar-hi una solució.
FJ Actualitzat per Ferran Jorba fa aproximadament 15 anys
De moment he fet que just després de baixar el PDF amb wget, normalitzi els noms dels fitxers amb una utilitat ja existent, detox (http://detox.sourceforge.net/ o http://packages.debian.org/detox). Prefereixo no reinventar la roda i seguir una utilitat ja establerta.
En principi les 856 locals haurien de generar-se amb aquest nom ja normalitzat, però no tancaré la tasca fins que ho tinguem confirmat.
FJ Actualitzat per Ferran Jorba fa aproximadament 15 anys
He aprofitat l'eina detox per normalitzar els noms dels fitxers dels que no es veien les miniatures i he arreglat les 856 mentrestant. Diria que ara està bé, sobretot el que estava pitjor http://ddd.uab.cat/record/44228, que he aprofitat per canviar els noms dels fitxers originals (http://www.recercat.net/handle/2072/4221) a $3 i $z.
No tanco la tasca, que he de confirmar que les noves entrades per OAI funcionin bé.
FJ Actualitzat per Ferran Jorba fa més de 13 anys
- Estat ha canviat de Creada a Tancada
Doncs sí, està funcionant bé. Esporàdicament, però, encara pot haver-hi alguna excepció, però tanquem la tasca.
CA Actualitzat per Cristina Azorin fa aproximadament 6 anys
- Tipus de tasca ha canviat de Defecte a Tasca