Projecte

General

Perfil

Accions

Tasca #7191

tancat
FJ FJ

Corregir automàticament els camps d'autoritat abans de les importacions de registres

Tasca #7191: Corregir automàticament els camps d'autoritat abans de les importacions de registres

Afegit per Ferran Jorba fa quasi 4 anys. Actualitzat fa quasi 4 anys.

Estat:
Tancada
Prioritat:
Normal
Assignat a:
Categoria:
Gestió de la col·lecció
Inici:
13-05-2022
Data de venciment:
Paraula clau:

Descripció

A la base de dades d'idautoritats hi ha desenes de milers de correccions ja fetes i validades via la interfície https://ddd.uab.cat/idautoritats.py. De tota manera, contínuament arriben nous registres que reprodueixen amb els mateixos errors. Això fa, d'una banda, que els registres s'hagin de corregir, ja sigui automàticament o manualment, i també que hi ha entrades que hem donat per bones a idautoritats i es tornen a "embrutar", i la llista mai no es buida.

Aquesta tasca serveix per provar, aprovar i decidir quins camps dels registres bibliogràfics, i en quines circumstàncies es poden fer correccions automàtiques quan es facin importacions de registres externs.

FJ Actualitzat per Ferran Jorba fa quasi 4 anys Accions #1

FJ Actualitzat per Ferran Jorba fa quasi 4 anys Accions #2

  • Estat ha canviat de Creada a En curs

La meva primera proposta és la següent:

A les etiquetes 100 i 700:

  1. Si hi ha orcid al $0 i ha estat validat, corregir (si cal) el $a.
  2. Si hi ha $u i ha estat corregit al menys un cop, canviar-lo pel canvi més recent.
  3. Crec que no podem corregir el $a si a l'etiqueta no hi ha orcid, perquè poden haver-hi diferents persones amb el mateix nom amb diferents correccions per diferenciar-los, i no és possible saber quina de les correccions és la vàlida.

A l'etiqueta 773:

  1. Si hi ha issn al $x i ha estat validat, corregir (si cal) el $t
  2. Però si no n'hi ha, i el $t ha estat corregit al menys cop, crec que sí que podem donar per bona la correcció més recent, perquè el nombre de títols de revistes (al menys les que tenim al DDD) ens permet fer les correccions amb certa confiança.

Una mostra de registres amb correccions (-abans i +després) de Pubmed i d'importacions diàries via oai, Scopus i repositoris serien aquests:

FJ Actualitzat per Ferran Jorba fa quasi 4 anys Accions #3

Havíem parlat també si corregir el 536 $a si hi ha doi al $d, segons la taula CompletarSubcampsCodificats, però encara no m'hi he posat.

Puc provar-ho i veure què passa, activant o no les correccions. Ho faig? També podem deixar-ho per una segona fase.

CA Actualitzat per Cristina Azorin fa quasi 4 anys Accions #4

Potser la 536 millor en una segona fase.

En el cas de 100 i 700 jo ho veig genial. He repassat els llistats i no he vist res fora de lloc.

FJ Actualitzat per Ferran Jorba fa quasi 4 anys Accions #5

A partir d'ara ja s'importaran corregides:

Els registres originals estaran a https://ddd.uab.cat/idregistres.py, a l'històric del DDD no hi seran, per no embrutar-lo més entrades que ja sabem que són errònies. Això hauria de tenir també un impacte positiu, doncs, a https://ddd.uab.cat/idautoritats.py.

Tancaré la tasca quan no hi hagi incidències i hàgim comprovat que tot va bé.

FJ Actualitzat per Ferran Jorba fa quasi 4 anys Accions #6

  • Estat ha canviat de En curs a Tancada

Doncs sí que funciona. Uns exemples de les darreres càrregues i tanco la tasca.

-100 1_ $0 0000-0002-6023-690X $a Sierra, Eliseo $u Universitat Autònoma de Barcelona. Departament de Dret Privat
+100 1_ $0 0000-0002-6023-690X $a Sierra Noguero, Eliseo $u Universitat Autònoma de Barcelona. Departament de Dret Privat
-100 1_ $a Saurí Pujol, David $u Departament de Geografia. Universitat Autònoma de Barcelona
+100 1_ $a Saurí Pujol, David $u Universitat Autònoma de Barcelona. Departament de Geografia
-700 1_ $0 0000-0003-4112-5195 $a Bertran Tarres, Marta $u Universitat Autònoma de Barcelona. Grup de Recerca EMIGRA
+700 1_ $0 0000-0003-4112-5195 $a Bertran, Marta $u Universitat Autònoma de Barcelona. Grup de Recerca EMIGRA
-700 1_ $0 0000-0002-0558-8486 $a Langemeyer, Johannes $u Universitat Autònoma de Barcelona (UAB). Institute of Environmental Science and Technology (ICTA-UAB)
+700 1_ $0 0000-0002-0558-8486 $a Langemeyer, Johannes $u Institut de Ciència i Tecnologia Ambientals
-700 1_ $0 0000-0003-1499-5478 $a Valdivia, P.
+700 1_ $0 0000-0003-1499-5478 $a Valdivia, Paloma
-100 1_ $a De Reymaeker, Brice $u Departament de Geografia Universitat Autònoma de Barcelona
+100 1_ $a De Reymaeker, Brice $u Universitat Autònoma de Barcelona. Departament de Geografia
-100 1_ $0 0000-0002-0953-2711 $a Grifell-Tatjé, E $u Departamento de la Empresa
+100 1_ $0 0000-0002-0953-2711 $a Grifell i Tatjé, Emili $u Departamento de la Empresa
-773 __ $g Vol. 16 Núm. 4 (2013), p. 581-583 $t European Journal of Social Work $x 1369-1457
+773 __ $g Vol. 16 Núm. 4 (2013), p. 581-583 $t European journal of social work $x 1369-1457
Accions

També disponible a: PDF Atom