Projecte

General

Perfil

Accions

Tasca #3228

tancat
NC FJ

Incidències de les càrregues des de ReDI al DDD

Tasca #3228: Incidències de les càrregues des de ReDI al DDD

Afegit per Núria Casaldaliga fa més de 11 anys. Actualitzat fa més de 10 anys.

Estat:
Tancada
Prioritat:
Normal
Assignat a:
Categoria:
Suport als usuaris
Temàtica prevista:
Inici:
18-12-2014
Data de venciment:
Paraula clau:

Descripció

Aquesta tasca ha de servir per detectar i solucionar les petites incidències que es poden derivar de les càrregues.


Tasques relacionades 2 (0 obertes2 tancades)

relacionat amb DDD - Tasca #2903: Automatització de les exportacions des de RACO a DDD - PRJ152TancadaCristina Azorin23-05-201419-12-2015Accions
relacionat amb DDD - Tasca #4679: S'estan important erròniament registres ja existents via OAITancadaFerran Jorba13-09-201722-12-2017Accions

NC Actualitzat per Núria Casaldaliga fa més de 11 anys Accions #1

1. Cal veure si es pot evitar que els canvis a REDI s'actualitzin automàticament als registres del DDD ja entrats. En molts casos fem millores manuals en el moment de carregar els articles i no les voldríem perdre.

CA Actualitzat per Cristina Azorin fa aproximadament 11 anys Accions #2

  • Paraula clau s'ha establert a JR

Potser caldria canviar el $3 de l'etiqueta 856 que porta a l'adreça de REDI, enlloc de Adreça alternativa hauria de dir Adreça original.

FJ Actualitzat per Ferran Jorba fa aproximadament 11 anys Accions #3

Cristina Azorin va escriure:

Potser caldria canviar el $3 de l'etiqueta 856 que porta a l'adreça de REDI, enlloc de Adreça alternativa hauria de dir Adreça original.

Ja ho he canviat per als nous registres.

FJ Actualitzat per Ferran Jorba fa aproximadament 11 anys Accions #4

Nuria Casaldaliga va escriure:

1. Cal veure si es pot evitar que els canvis a REDI s'actualitzin automàticament als registres del DDD ja entrats. En molts casos fem millores manuals en el moment de carregar els articles i no les voldríem perdre.

Amb el TDX ja vam decidir fer-ho exactament així. Vam estar parlant amb la Cristina sobre quines opcions hi havia. Ara matex, si s'utilitza el client OAI d'Invenio, l'avantatge és que l'administradora (la Cristina) pot fer i desfer des de la pròpia aplicació, però ara mateix no sé si és possible que només ens agafi articles nous. En el cas del TDX, com que només és un, doncs vam considerar que no caldria fer-ne un problema, però de revistes a la UAB en surten més que bolets després d'un dia de pluja...

La veritat és que ara mateix encara no tinc la resposta.

FJ Actualitzat per Ferran Jorba fa aproximadament 11 anys Accions #5

  • Estat ha canviat de Creada a En curs

Em sembla que he trobat la manera i el lloc perquè no ens entrin al DDD els articles «antics» del OJS, ara per ara el ReDI. Tal com vam comentar amb la Cristina, el problema amb el procediment que estava fent servir fins ara era que agafava la data a partir del Dublin Core, però el Dublin Core del OJS utilitza la data de quan es genera l'article, no el de publicació, ex:

http://revistes.uab.cat/enrahonar/oai?verb=GetRecord&metadataPrefix=oai_dc&identifier=oai:enrahonar.revistes.uab.cat:article/501

Jo estava utilitzant el format DC perquè és el que tenim en el moment de la captura OAI. La solució la tenim utilitzant el registre en format NLM (que, de fet, és que ja estem utilitzant en general perquè és el que més s'assembla al Marc21), que sí que diferencia les dates, ex:

http://revistes.uab.cat/enrahonar/oai?verb=GetRecord&metadataPrefix=nlm&identifier=oai:enrahonar.revistes.uab.cat:article/501

El que acabo de fer és que en el moment d'enriquir el registre, és a dir, de passar de les dades mínimes en DC al registre complet en Marc21, i abans de recollir el PDF, ja mira la data real de publicació i, si és anterior al 2015, li afegeix un 980 $c DELETED i ja no recull el PDF.

De tota manera, com sempre en el cas del OJS, cal confirmar que efectuvament funcioni bé ;-)

FJ Actualitzat per Ferran Jorba fa aproximadament 11 anys Accions #6

De tota manera, i perquè quedi clar: la nota anterior no soluciona el que no volem que si en el OJS remot es corregeix un registre, nosaltres no volem aquesta correcció al DDD. Continua pendent.

FJ Actualitzat per Ferran Jorba fa quasi 11 anys Accions #7

Ferran Jorba va escriure:

De tota manera, i perquè quedi clar: la nota anterior no soluciona el que no volem que si en el OJS remot es corregeix un registre, nosaltres no volem aquesta correcció al DDD. Continua pendent.

La solució me la van donar els del CERN, i ara hi estic treballant.

https://www.mail-archive.com/project-invenio-general@cern.ch/msg00969.html

És important perquè el editors de les revistes estan molt atrafegats carregant articles antics als seus sistemes OJS.

FJ Actualitzat per Ferran Jorba fa quasi 11 anys Accions #8

Ferran Jorba va escriure:

De tota manera, i perquè quedi clar: la nota anterior no soluciona el que no volem que si en el OJS remot es corregeix un registre, nosaltres no volem aquesta correcció al DDD. Continua pendent.

La solució me la van donar els del CERN, i ara hi estic treballant.

Jo crec que ja ho tinc, i és una simplificació del script que fan servir al CERN que em fan donar com a exemple (https://github.com/inspirehep/inspire/blob/master/bibharvest/bibfilter_oaiarXiv2inspire.py), i que bàsicament detecta registres existents a la base de dades ja sigui per la 001 o per la 035. És millor que res, però evidentment és limitat, perquè no pot detectar registres que no hàgim recol·lectat prèviament via OAI dels seus OJS i per tant que ja tinguin una 035 amb el seu identificador OAI. Al DDD de proves m'ha funcionat correctament.

De tota manera, la detecció de registres «antics» que s'hagin pogut carregar als OJS de les revistes de la UAB ara ja es fa per data de publicació. No es carrega res publicat d'abans del 2015.

Cristina, per aplicar-ho a qualsevol altre font OAI, es tracta de copiar el nom del programa que veuràs en els OJS de la UAB i posar-lo a la casella «BibFilter program (if needed by postprocess)»: /home/ddd/bin/bibfilter_insert.py.

CA Actualitzat per Cristina Azorin fa quasi 11 anys Accions #9

  • Estat ha canviat de En curs a Tancada

Tanquem la tasca perquè hi ha alguna incidència molt menor que solucionem via correu electrònic. Si fos necessari es tornaria a obrir una tasca en cas d'incidència greu.

CA Actualitzat per Cristina Azorin fa més de 10 anys Accions #10

La tasca està tancada però apuntem les incidències pel futur.

Tiempo devorado vol.2 num. 1 ha passat bé.

Brumal ha tingut problemes de càrrega en els pdf. les urls (en passar el ratolí per sobre de la columna
de la dreta amb els PDFs) són del tipus:

Fan, p. ex:

REDI és molt flexible i permet fer el que l'administrador vulgui, o és molt caòtic i permet fer el que a
l'administrador li dóna la gana (són dues maneres de dir el mateix, segons es digui amb to positiu o crític).

FJ Actualitzat per Ferran Jorba fa més de 10 anys Accions #11

  • Estat ha canviat de Tancada a En curs

Reobrim la tasca, d'acord amb la Cristina.

Resulta que des de vam instal·lar la versió 1.1.2, l'apanyo que ens van recomanar els del CERN perquè no ens sobreescrigui registres que ja tenim al DDD, ha deixat de funcionar. Cal corregir-ho.

FJ Actualitzat per Ferran Jorba fa més de 10 anys Accions #12

Una possible explicació és que, segons la documentació (https://ddd.uab.cat/help/admin/oaiharvest-admin-guide) sembla que perquè el programa que triem per bibfilter funcioni, ha d'estar marcada la casella filter a la secció Postrocess.

De moment els estic marcant tots, i mirarem si amb això funciona. És curiós perquè, efectivament, la casella filter no la teníem activada per a cap servidor OAI.

CA Actualitzat per Cristina Azorin fa més de 10 anys Accions #13

  • Estat ha canviat de En curs a Tancada

De moment tot va bé

CA Actualitzat per Cristina Azorin fa més de 10 anys Accions #14

  • Categoria s'ha establert a Suport als usuaris

CA Actualitzat per Cristina Azorin fa més de 10 anys Accions #15

  • Paraula clau s'ha suprimit (JR)

FJ Actualitzat per Ferran Jorba fa més de 8 anys Accions #16

  • S'ha afegit relacionat amb Tasca #4679: S'estan important erròniament registres ja existents via OAI
Accions

També disponible a: PDF Atom