Tasca #4955
tancatIdentificar els DOIs erronis i el seu origen
Afegit per Ferran Jorba fa aproximadament 8 anys. Actualitzat fa més de 5 anys.
Descripció
Al DDD hi ha una quantitat important de DOIs que donen error. Però si s'eliminen manualment, de vegades tornen a aparèixer, perquè pot ser que s'hagin afegit automàticament via idregistres (tasca #4476).
Hem vist que una part d'ells venen de Racó, tot i que no sempre es veuen. Per exemple, aquest registre en versió OAI té DOI però no es veu en html:
- http://www.raco.cat/index.php/index/oai?verb=GetRecord&metadataPrefix=nlm&identifier=oai:raco.cat:article/291642
- http://www.raco.cat/index.php/Athenea/article/view/291642
Aquest altre té DOI i es veu tant via OAI com en html:
- http://www.raco.cat/index.php/index/oai?verb=GetRecord&metadataPrefix=nlm&identifier=oai:raco.cat:article/298290
- http://www.raco.cat/index.php/QuadernsPsicologia/article/view/10.5565-rev-psicologia.1155
Abans de saber com actuem sense que els errors es tornin a reproduir automàticament, val la pena tenir xifres de tot plegat. Entenc que es poden combinar les dades internes de les tasques #4476 i #4950.
Tasques relacionades 3 (0 obertes — 3 tancades)
FJ Actualitzat per Ferran Jorba fa aproximadament 8 anys Accions #1
- S'ha afegit relacionat amb Tasca #4476: Programa per identificar registres externs al DDD
FJ Actualitzat per Ferran Jorba fa aproximadament 8 anys Accions #2
- S'ha afegit relacionat amb Tasca #4950: Refer internament la base de dades de cites de Scopus i WoS
FJ Actualitzat per Ferran Jorba fa aproximadament 8 anys Accions #3
Dels 8434 dois al DDD dels que ara mateix tinc informació de si són correctes o no, 6147 funcionen i 2287 (un 27%) donen error. Són molts.
FJ Actualitzat per Ferran Jorba fa quasi 8 anys Accions #4
- Estat ha canviat de Creada a En curs
No recordo els detalls de l'origen, però sí que vam quedar que, d'una banda, s'eliminarien els dois de Racó i, de l'altra, que jo eliminaria els erronis del DDD.
Avui he començat a fer la primera tanda. Dels 3.739 dois que donen error que tenim al DDD, dues terceres parts són de la UAB (2.614, que comencen per 10.5565) i una tercera part (1.125) no.
De moment elimino els donen error i comencen per 10.5565, perquè també és un compromís que tenim amb el Servei de Publicacions, i després ja ens mirarem l'origen dels altres.
CA Actualitzat per Cristina Azorin fa quasi 8 anys Accions #5
- Prioritat ha canviat de Normal a Urgent
FJ Actualitzat per Ferran Jorba fa quasi 8 anys Accions #6
Com que sembla que a Racó no els acaben d'esborrar, he fet que ignori els dos tipus de dois que constatem que són erronis: els que contenen 10.1234/no.disponible.a.RACO i els que comencen per 10.5565 i tenen un sufix numèric.
De fet, això pensava que ja estava fet, però no vaig poder verificar-ho perquè estava en altres temes i després he vist que només ho havia fet bé pel primer dels dos casos. Avui comença a netejar el segon; són 2026 registres.
FJ Actualitzat per Ferran Jorba fa més de 7 anys Accions #7
La llista actualitzada diàriament dels dois erronis està a:
https://ddd.uab.cat/qualitat/doi2error.tab
És un fitxer ordenat per doi i, per tant, agrupats per editor. Llevat de les incidències conegudes, com els de la UAB (prefix 10.5565), entenc que cal revisar-los manualment.
CA Actualitzat per Cristina Azorin fa més de 7 anys Accions #8
- Paraula clau s'ha establert a JR
FJ Actualitzat per Ferran Jorba fa més de 7 anys Accions #9
Hem comprovat que el llistat https://ddd.uab.cat/qualitat/doi2error.tab té alguns inconvenients.
La informació dels dois sovint és obsoleta. Quan es corregeix el doi del registres, el llistat encara reflecteix el doi obsolet fins que no li toca la propera comprovació. Com que se'n fan 1000 cada dia, passen més de dues setmanes fins que es torna a actualitzar el valor.
A part del llistat per ordenat per doi, també estaria bé fer-ne un per data. (Tot i que estic pensant que si el punt anterior se soluciona, igual no caldria...)
FJ Actualitzat per Ferran Jorba fa més de 7 anys Accions #10
Ferran Jorba va escriure:
Hem comprovat que el llistat https://ddd.uab.cat/qualitat/doi2error.tab té alguns inconvenients.
La informació dels dois sovint és obsoleta. Quan es corregeix el doi del registres, el llistat encara reflecteix el doi obsolet fins que no li toca la propera comprovació. Com que se'n fan 1000 cada dia, passen més de dues setmanes fins que es torna a actualitzar el valor.
De moment he fet que els dois esborrats o corregits ja no surtin en el llistat; per tenir-ho ben actualitzat, em falta afegir-hi els nous, que ara mateix trigarien 24 hores en aparèixer; ho afegiré després.
FJ Actualitzat per Ferran Jorba fa més de 7 anys Accions #11
Em sembla que ja està. Ara de llistats n'hi haurà dos, un d'ordenat per data de comprovació (de més recent a més antiga), i l'altre per doi (per tant, per editor), i només amb la informació actualitzada (del dia anterior, això sí):
FJ Actualitzat per Ferran Jorba fa més de 7 anys Accions #13
- Estat ha canviat de En curs a Tancada
CA Actualitzat per Cristina Azorin fa més de 7 anys Accions #14
- Prioritat ha canviat de Urgent a Normal
Els que cal arreglar manualment els assumirem des de la UTP amb les actuacions de qualitat
CA Actualitzat per Cristina Azorin fa aproximadament 7 anys Accions #15
- Paraula clau s'ha suprimit (
JR)
FJ Actualitzat per Ferran Jorba fa aproximadament 7 anys Accions #16
Repassant el llistat diari, me n'he adonat que el llistat seria més útil si hi aparegués el títol de la revista. Des d'avui hi sortirà:
Les que no en tenen en general és perquè estan a la col·lecció revisar (és a dir, registres no públicss) i el títol l'hauria de treure d'una manera més farragosa, que m'he volgut estalviar per a aquest cas concret, que podia fer-ho de manera molt més senzilla.
CA Actualitzat per Cristina Azorin fa aproximadament 7 anys Accions #17
Gràcies Ferran, va molt millor, però segueixen sortint DOIs que després funcionen correctament, exemples:
- https://ddd.uab.cat/record/129439
- https://ddd.uab.cat/record/168406
FJ Actualitzat per Ferran Jorba fa aproximadament 7 anys Accions #18
- Estat ha canviat de Tancada a En curs
Sí, n'he vist alguns. Ara que el número és més raonable, intentaré d'entendre què passa, perquè rebo missatges contraditoris: amb un status code 400, però els redireccionaments funcionen, ex:
#get_doi_status_code4: status code 400, url https://doi.org/10.1117/1.JRS.7.074594
#get_doi_status_code5: status code 400, url http://remotesensing.spiedigitallibrary.org/article.aspx?doi=10.1117/1.JRS.7.074594
#get_doi_status_code4: status code 400, url https://doi.org/10.1117/1.JRS.9.097496
#get_doi_status_code5: status code 400, url http://remotesensing.spiedigitallibrary.org/article.aspx?doi=10.1117/1.JRS.9.097496
#get_doi_status_code4: status code 400, url https://doi.org/10.1117/1.JRS.9.097498
#get_doi_status_code5: status code 400, url http://remotesensing.spiedigitallibrary.org/article.aspx?doi=10.1117/1.JRS.9.097498
#get_doi_status_code4: status code 400, url https://doi.org/10.3372/wi.46.46305
#get_doi_status_code5: status code 400, url http://www.bioone.org/doi/10.3372/wi.46.46305
#get_doi_status_code4: status code 400, url https://doi.org/10.1117/1.JBO.22.5.056004
#get_doi_status_code5: status code 400, url http://biomedicaloptics.spiedigitallibrary.org/article.aspx?doi=10.1117/1.JBO.22.5.056004
#get_doi_status_code4: status code 400, url https://doi.org/10.1117/1.OE.55.10.103108
#get_doi_status_code5: status code 400, url http://opticalengineering.spiedigitallibrary.org/article.aspx?doi=10.1117/1.OE.55.10.103108
#get_doi_status_code4: status code 400, url https://doi.org/10.1117/1.OE.56.11.113114
#get_doi_status_code5: status code 400, url https://www.spiedigitallibrary.org/journals/optical-engineering/volume-56/issue-11/113114/Optical-triple-random-phase-encryption/10.1117/1.OE.56.11.113114.full
Reobro la tasca.
CA Actualitzat per Cristina Azorin fa aproximadament 7 anys Accions #19
Amb el Manuel estàvem pensant, enlloc de dir si va bé o no perquè enllaça amb l'article o la revista, podríem posar al llistat els que donen error de crossref, és a dir, els que van a parar a la pàgina de doi.org (not found). És una idea...
FJ Actualitzat per Ferran Jorba fa aproximadament 7 anys Accions #20
Sense descartar-ho, acabo de fer una altra acció: per als dois que donen error (ara mateix uns 175), es comprovaran en ordre aleatori. Ho faig així perquè estic veient que alguns dels que estan a la llista dels errors en altres hores sí que funcionen.
CA Actualitzat per Cristina Azorin fa aproximadament 6 anys Accions #21
- Paraula clau s'ha establert a NC
CA Actualitzat per Cristina Azorin fa aproximadament 6 anys Accions #22
- Paraula clau ha canviat de NC a NCR
CA Actualitzat per Cristina Azorin fa quasi 6 anys Accions #23
- S'ha afegit relacionat amb Tasca #5682: Neteja dels identificadors de Scopus que el programa detecta duplicats (idregistres)
CA Actualitzat per Cristina Azorin fa quasi 6 anys Accions #24
- Data de venciment s'ha establert a 29-07-2020
- Assignat a ha canviat de Ferran Jorba a Manuel Montoza Coca
- Prioritat ha canviat de Normal a Alta
CA Actualitzat per Cristina Azorin fa més de 5 anys Accions #25
- Estat ha canviat de En curs a Tancada
- Prioritat ha canviat de Alta a Normal
Les millores en el programa ja estan fetes, la comprovació de DOIs queda com una tasca regular del DDD.
CA Actualitzat per Cristina Azorin fa més de 5 anys Accions #26
- Paraula clau s'ha suprimit (
NCR)