Projecte

General

Perfil

Accions

Tasca #6701

tancat
FJ FJ

Permetre importar registres a partir del doi, handle o url quan no estiguin a Scopus (Dialnet?)

Tasca #6701: Permetre importar registres a partir del doi, handle o url quan no estiguin a Scopus (Dialnet?)

Afegit per Ferran Jorba fa aproximadament 4 anys. Actualitzat fa aproximadament 3 anys.

Estat:
Tancada
Prioritat:
Normal
Assignat a:
Categoria:
Tecnologia
Temàtica prevista:
Inici:
19-01-2022
Data de venciment:
30-12-2022
Paraula clau:

Descripció

Scopus cobreix força bé els àmbits científico-tècnics, però poc els humanístics, de comunicació o locals. Algunes de nostres biblioteques involucrades han comprovat que Dialnet és una excel·lent font d'informació de les publicacions dels nostres investigadors. Malhauradament, el procediment que ofereixen a Dialnet per descarregar aquesta informació és excessivament manual i no sembla prou pràctic. Però sí que podem aprofitar de les seves extraccions, per exemple, el llistat de dois o urls.

En tot cas, en els darrers anys, i sobretot gràcies a la presió de Google Scholar, la majoria dels repositoris, editors i webs especialitzades acostumen a incloure a les pàgines canòniques dels registres les metadades en un o dos formats: el Google citation metadata i Dublin Core. La veritat és que els camps que proposa Google Scholar (https://scholar.google.com/intl/en/scholar/inclusion.html#indexing) ens són força més útils que els de Dublin Core; per exemple, inclouen específicament el doi, la primera i última pàgina, especifiquen l'issn o el títol de la revista, que en el cas de Dublin Core són molt més genèrics. També, a més a més, inclouen específicament l'adreça del pdf, que si no fos per aquests valors, de vegades no és fàcil de deduir (p. ex., en el cas de OJS).

Resulta a més que una part molt significativa de les webs originals d'aquest conjunt d'articles són OJS o DSpace, que tenen servidor OAI i la és, en general, deduïble per la url. I a partir de l'adreça doi se'n poden extreure totes les metadades típiques OAI.

D'altra banda, entenc que fins que no es demostri el contrari, no hem de creure que les dades de Dialnet siguin necessàriament millors que els dels repositoris o editors originals.

Per tant, crec que val la pena fer la prova, per confirmar o no que sigui útil. De fet, es tracta d'aprofitar molta part que ja tenim preparada: la recollida dels dois (https://ddd.uab.cat/dois.py), amb els camps que hem anat polint, i tot el que ja recollim via oai (consultable via https://ddd.uab.cat/idregistres.py), i embastar-ho tot junt.


Tasques relacionades 3 (0 obertes3 tancades)

relacionat amb DDD - Tasca #4614: Extracció automàtica de la base de dades de Scopus a partir de l'APITancadaFerran Jorba03-07-201725-02-2019Accions
relacionat amb Accions de millora - Millora #6880: 2022/027 Facilitar l'entrada d'articles al DDDTancadaCristina Azorin10-01-202214-02-2022Accions
relacionat amb Docència i recerca - Tasca #6347: Publicació de documents del DIALNET al DDDTancadaCristina Azorin24-03-202131-05-2022Accions

FJ Actualitzat per Ferran Jorba fa aproximadament 4 anys Accions #1

  • S'ha afegit relacionat amb Tasca #4614: Extracció automàtica de la base de dades de Scopus a partir de l'API

FJ Actualitzat per Ferran Jorba fa aproximadament 4 anys Accions #2

FJ Actualitzat per Ferran Jorba fa aproximadament 4 anys Accions #3

La Montse Bravo ja m'ha passat una desena de dois i urls per carregar a la seva biblioteca i són els que faig servir per les meves proves.

FJ Actualitzat per Ferran Jorba fa aproximadament 4 anys Accions #4

  • Estat ha canviat de Creada a En curs

FJ Actualitzat per Ferran Jorba fa aproximadament 4 anys Accions #5

De la primer llista de 10 dois/urls que m'ha passat la Montse, he capturat aquesta informació dels registres i la conversió a Marc21. Encara no els he carregat al DDD, perquè he de fer encara una altra repassada, però de moment els podeu veure a idregistres:

  1. https://ddd.uab.cat/idregistres.py/search?q=oai:ojs.revistas.upb.edu.co:article/7097 10.18566/comunica.n44.a04
  2. https://ddd.uab.cat/idregistres.py/search?q=oai:revistas.unav.edu:article/39075 10.15581/003.34.1.157-175
  3. https://ddd.uab.cat/idregistres.py/search?q=oai:revistas.unav.edu:article/40171 10.15581/003.34.3.61-76
  4. https://ddd.uab.cat/idregistres.py/search?q=oai:ojs2.adresearch.publicacionesacademicas.es:article/139 10.7263/adresic-023-03
  5. https://ddd.uab.cat/idregistres.py/search?q=oai:idus.us.es:11441/103654 10.12795 / IC.2020.i01.19
  6. https://ddd.uab.cat/idregistres.py/search?q=oai:ojs2.revistascientificas.uspceu.com:article/597 10.31921/doxacom.n28
  7. https://ddd.uab.cat/idregistres.py/search?q=oai:ojs5k.www.revistaeic.eu:article/193 10.24137/raeic.6.11.11

N'hi ha un altre, http://www.scielo.org.mx/scielo.php?script=sci_arttext&pid=S0188-252X2013000200008, que l'he convertit i es podrà importar, però com que no té identificador oai ni doi, de moment no estic convençut que el pugui posar a idregistres, de manera que ara mateix no el podeu veure. Finalment, del https://telos.fundaciontelefonica.com/archivo/numero100/aportaciones-desde-la-comunicacion-y-la-cultura/ no he pogut capturar res, perquè està fet amb Wordpress i no té metadades bibliogràfiques a la pàgina web.

CA Actualitzat per Cristina Azorin fa aproximadament 4 anys Accions #6

  • Data de venciment s'ha establert a 24-06-2022

Gràcies Ferran.

Agafo el primer registre i et faig alguns comentaris:

024 7_ $2 doi $a 2386-7876

Atenció perquè és el ISSN (que ja està bé a la 773) i no el DOI.

251 _ $a publishedVersion
251 _
$a Versió publicada

Cal eliminar la primera.

655 7 $a Article
655 _
$a Article

Cal eliminar la segona.

856 41 $3 Adreça original $u https://revistas.unav.edu/index.php/communication-and-society/article/view/39075

Suposo que donant l'adreça original la intenció és que el personal de la biblioteca pugi els fitxers amb posterioritat. En aquest cas, per exemple, hi ha el pdf i un excel amb material complementari.

Potser es podria recuperar l'etiqueta de drets, encara que s'hagués de revisar. Montse, tu què hi dius?

<dc:rights xml:lang="en-US">Copyright (c) 2021 Communication & Society</dc:rights>

FJ Actualitzat per Ferran Jorba fa aproximadament 4 anys Accions #7

Gràcies per les observacions, Cristina, ja ho he corregit. I sí, l'adreça original hi és perquè consti, i perquè pugueu agafar el pdf. Ara mateix encara no sé si em serà fàcil adjuntar-lo jo mateix.

FJ Actualitzat per Ferran Jorba fa aproximadament 4 anys Accions #8

Ja n'he fet la primera càrrega. De moment encara no he provat d'agafar els pdf automàticament; si de cas, ja no farem més endavant. Però si hi ha correccions, observacions o comentaris, endavant. Dit això, Montse, per mi ja els pots revisar, editar, etc, i integrar-los al circuit habitual. Es tracta d'aquests registres:

---log---
2022-01-21 11:58:07 --> Task #815313 started.
2022-01-21 11:58:07 --> Input file '/home/ddd/tmp/dois_a2021mFJd2.marcxml', input mode 'insert'.
2022-01-21 11:58:08 --> https://ddd.uab.cat/record/251154 DONE
2022-01-21 11:58:08 --> https://ddd.uab.cat/record/251155 DONE
2022-01-21 11:58:09 --> https://ddd.uab.cat/record/251156 DONE
2022-01-21 11:58:09 --> https://ddd.uab.cat/record/251157 DONE
2022-01-21 11:58:09 --> https://ddd.uab.cat/record/251158 DONE
2022-01-21 11:58:09 --> https://ddd.uab.cat/record/251159 DONE
2022-01-21 11:58:09 --> https://ddd.uab.cat/record/251160 DONE
2022-01-21 11:58:10 --> https://ddd.uab.cat/record/251161 DONE
2022-01-21 11:58:10 --> Task stats: 8 input records, 0 updated, 8 inserted, 0 errors, 0 inserted to holding pen. Time 3.11 sec.
2022-01-21 11:58:10 --> Task #815313 finished. [DONE]
---err---
---eof---

MB Actualitzat per Montse Bravo fa aproximadament 4 anys Accions #9

he fet una primera ullada. L'etiqueta de drets està a un parell de registres (https://ddd.uab.cat/record/251160 i https://ddd.uab.cat/record/251156) i en tots dos correspon a la CC que demana la revista. Si això es pot fer en tots els registres seria genial (porta temps anar a buscar aquesta informació) encara que després calgui fer una 540 normalitzada.
Per la resta prou bé. Només en un article (https://ddd.uab.cat/record/251161) es veuen malament els accents; també és l'article amb menys informació

FJ Actualitzat per Ferran Jorba fa aproximadament 4 anys Accions #10

Montse Bravo va escriure:

he fet una primera ullada. L'etiqueta de drets està a un parell de registres (https://ddd.uab.cat/record/251160 i https://ddd.uab.cat/record/251156) i en tots dos correspon a la CC que demana la revista. Si això es pot fer en tots els registres seria genial (porta temps anar a buscar aquesta informació) encara que després calgui fer una 540 normalitzada.

Sí, tens raó. El que ara farà és que si el camp de dc:rights comença per http, anirà al $u de la 540, i si no, al $a.

Per la resta prou bé. Només en un article (https://ddd.uab.cat/record/251161) es veuen malament els accents; també és l'article amb menys informació

Veurem si en surten més abans de posar-m'hi; les persones ho detectem fàcilment, però és difícil que un programa ho corregeixi bé sempre.

FJ Actualitzat per Ferran Jorba fa aproximadament 4 anys Accions #11

He carregat 10 registres més de prova de Comunicació. Sembla que va força bé:

Què us sembla, ho passo ja a https://ddd.uab.cat/dois.py amb l'avís que està en fase de proves. i si falla que ho apuntin aquí a la tasca?

Queda pendent el penjar el pdf, però no tinc clar en quin moment em convé fer-ho, i prefereixo pensar-m'ho una mica més.

FJ Actualitzat per Ferran Jorba fa aproximadament 4 anys Accions #12

Acabo de passar la nova funcionalitat al programa públic: https://ddd.uab.cat/dois.py

CA Actualitzat per Cristina Azorin fa aproximadament 4 anys Accions #13

  • Paraula clau ha canviat de dialnet a dialnet NCR

CA Actualitzat per Cristina Azorin fa aproximadament 4 anys Accions #14

He afegit una nota explicativa al davant del formulari d'entrada d'articles:

https://ddd.uab.cat/submit?ln=ca&doctype=ARTPUB

CA Actualitzat per Cristina Azorin fa aproximadament 4 anys Accions #15

  • S'ha afegit relacionat amb Millora #6880: 2022/027 Facilitar l'entrada d'articles al DDD

FJ Actualitzat per Ferran Jorba fa aproximadament 4 anys Accions #16

Hem vist que alguns editor comercials, sobretot els grans noms fan uns quants redireccionaments amb Javascript del DOI a la pàgina de l'article, i això fa que els scripts i programes sovint no poden fer tots els passos fins a arribar a la pàgina destí. Després resulta que sí, que la pàgina de l'article té les metadades Google i Dublin Core que ens permeten importar els registres.

Per tant, si la importació no funciona per doi, ho podeu tornar a provar a partir de la pàgina de l'article de la web de l'editor. Un exemple és el doi 10.3390/women1040018 (https://doi.org/10.3390/women1040018), que el programa no va poder importar, però a partir de la pàgina de l'article, https://www.mdpi.com/2673-4184/1/4/18, es va poder importar perfectament: https://ddd.uab.cat/record/255143 (https://ddd.uab.cat/bibversions.py?recid=255143)

Segurament aquesta informació l'hauria de posar al formulari https://ddd.uab.cat/dois.py, però hauria de ser de forma breu i clara; de moment deixo la versió llarga i amb exemples aquí mateix.

CA Actualitzat per Cristina Azorin fa quasi 4 anys Accions #17

  • S'ha afegit relacionat amb Tasca #6347: Publicació de documents del DIALNET al DDD

CA Actualitzat per Cristina Azorin fa aproximadament 3 anys Accions #18

  • Data de venciment ha canviat de 24-06-2022 a 30-12-2022
  • Prioritat ha canviat de Normal a Alta

CA Actualitzat per Cristina Azorin fa aproximadament 3 anys Accions #19

  • Estat ha canviat de En curs a Tancada
  • Prioritat ha canviat de Alta a Normal

L'opció de 'repositoris originals' de la pàgina https://ddd.uab.cat/dois.py ja ho permet.

CA Actualitzat per Cristina Azorin fa aproximadament 3 anys Accions #20

  • Paraula clau s'ha suprimit (dialnet NCR)
Accions

També disponible a: PDF Atom