Tasca #3215
tancatTasca #3268: Objectius i tasques per fer a casa en teletreball (Ferran)
Normalitzar i codificar automàticament els departaments, facultats i altres unitats de la UAB
Descripció
Al DDD hi ha moltíssimes entrades corporatives amb diferents unitats de la UAB, que venen de diferents procedències: formularis, registres recollits via OAI o del catàleg, etc. Aquestes entrades tenen diferents formes i subcamps; de vegades estan junts en el $a la UAB i l'unitat, de vegades la unitat està en un $b, de vegades està codificada amb un $9 i de vegades no.
Sobretot pel que fa a la creació de col·leccions o preparar cerques, és especialment important que a totes les entrades 110, 610 o 710 de la UAB estiguin codificades i normalitzades.
Cal escriure un script que ho faci automàticament. Cal corregir tots els registres previs i cal que cada dia autocorregeixi els nous.
Tasques relacionades 3 (0 obertes — 3 tancades)
FJ Actualitzat per Ferran Jorba fa més de 11 anys
- Estat ha canviat de Creada a En curs
Ahir va començar a funcionar. Ara mateix fa aquestes correccions:
- Si està tot junt en un $a, separa en un $b el que va després del punt de «Universitat Autònoma de Barcelona.»
- Si la subunitat (facultat, departament, biblioteca, etc.) està en un $a, sense que hi digui enlloc «Universitat Autònoma de Barcelona», afegeix un $a amb la UAB i la unitat la posa en el $b.
- Si hi ha $b però no $9, cerca a la taula d'entitats de la UAB si la tenim, Si no hi és, fa una segona cerca sense accents i en minúscules.
En un primer càlcul el programa diu que se n'han de corregir més de 39.000. Avui ja n'hi ha els primers 500 de corregits. Calculo que el cap de setmana els podrà corregir tots, i la setmana que ve farem una avaluació de quins queden, per ampliar, si és possible, les correccions automàtiques.
FJ Actualitzat per Ferran Jorba fa aproximadament 11 anys
- Estat ha canviat de En curs a Tancada
Jo crec que ja fa automàticament tot el que es pot fer, i com que s'executa automàticament cada nit, anirà afegint codis quan es trobi amb nou casos. Això sí, sempre caldrà una repassada manual del fitxer http://ddd.uab.cat/autoritats/institucions.txt per corregir aquells casos que el programa no detecti.
FJ Actualitzat per Ferran Jorba fa aproximadament 11 anys
- Tasca pare s'ha establert a #3268
CA Actualitzat per Cristina Azorin fa més de 10 anys
- Categoria s'ha establert a Suport als usuaris
FJ Actualitzat per Ferran Jorba fa aproximadament 9 anys
- S'ha afegit relacionat amb Tasca #2988: Assignar codis de manera automàtica a les facultats