Tasca #5253
tancatExtracció automàtica de la base de dades de Crossref a partir de l'API
Descripció
Ara ja tenim una extracció automàtica d'informació bibliogràfica de Scopus a partir del doi (#4614). Però, a partir dels errors que hem estat rebent, hi ha una certa quantitat de registres que no hi són a Scopus però sí a la base de dades de dois (https://doi.org). Perquè, de fet, la web https://doi.org no només serveix de repositori d'adreces permanents (i curtes) que redirigeixen a la web oficial (típicament de l'editor), sinó que també conté una base de dades bibliogràfica que és accessible via api. Perquè, a hores d'ara, ja sabem que per registrar un doi, cal informar d'una certa quantitat d'informació bibliogràfica, que típicament aporta l'editor.
Aquesta tasca és per avaluar la possibilitat d'aprofitar aquesta informació quan no existeix el registre a Scopus (per exemple) però sí a https://doi.org. Estic pensant de posar-ho com una casella opcional a https://ddd.uab.cat/dois.py (amb un valor predeterminat de sí o no, ja ho concretarem).
He trobat unes quantes fonts d'informació de com extreure-la (majoritàriament a partir de la primera entrada i estirant del fil de les referencies):
- https://stackoverflow.com/questions/10507049/get-metadata-from-doi
- http://www.doi2bib.org/ (servei web perquè es pugui fer la consulta sense utilitzar l'api)
- https://github.com/davidagraf/doi2bib (programa que hi ha al darrera del servei anterior)
Al final de l'entrada de stackoverflow.com, hi ha aquesta frase, que no estic segur de quina importància té, ja que les proves que estic fent funcionen sense haver-nos-hi registrat:
CrossRef has an API, which you can use with an API key that can be obtained free of charge from http://www.crossref.org/requestaccount/.
Fitxers