Tasca #6988
tancatTractar les càrregues de PubMed com les recol·leccions OAI
Descripció
Les càrregues de PubMed funcionen d'aquesta manera:
Un dia la setmana (actualment diumenge a la tarda) es fan unes cerques a PubMed per trobar registres pressumptament de la UAB. Se'n fa una per any des del 2000 a l'any actual:
UAB bellaterra[Affiliation] OR (autonom* AND barcelona[Affiliation]) OR (campus autonom* AND barcelona[Affiliation]) OR bellaterra[Affiliation] OR ATONOMA BARCELONA[Affiliation] OR AUTANOMA BARCELONA[Affiliation] OR AUTNOMA BARCELONA[Affiliation] OR AUTOMA BARCELONA[Affiliation] OR AUTOMONA BARCELONA[Affiliation] OR AUTOMOUS BARCELONA[Affiliation] OR AUTONAMA BARCELONA[Affiliation] OR autonoma barcelona OR UAB barcelona[Affiliation]
D'aquests registres es creuen amb la llista de registres que consta que són d'accés obert i que estan a:
https://ftp.ncbi.nlm.nih.gov/pub/pmc/oa_file_list.txt
Agafem també una llista d'equivalències de pmid, dois, etc que està a:
https://ftp.ncbi.nlm.nih.gov/pub/pmc/PMC-ids.csv.gz
Aquesta llista ens serveix per saber si un registre ja el tenim via DOI, però també per afegir-hi el registre pmid de registres que ja tinguem.
Després el registre el recol·lectem via OAI, amb una sintaxi com aquesta:
Per tant, tot i que no és una recol·lecció OAI, se li assembla molt. Crec que val la pena fer-ho, i amb aixó tindrem:
- Accés als registres originals via https://ddd.uab.cat/idregistres.py
- Ús d'un client OAI especialitzat com Sickle, i d'aquesta manera possiblement solucionar els problemes de diacrítics que tenim darrerament.