Tasca #2813
tancatAfegir al registres complets l'identificador del PubMed
Descripció
caldria afegir als registres complets, a sota del DOI, l'identificador del PubMed amb la seva adreça arrel. Aquest identificador en molts casos ens arriba de l'Àrea de Gestió de la Recerca.
024 8_ $a 18488557 $9 pmid
De moment no posem un 024 7_ ni un $2 perquè el codi no apareix com identificador acceptat a MARC21, si aparegués en el futur faríem un canvi global.
L'adreça arrel és http://www.ncbi.nlm.nih.gov/pubmed/?term=XXXXXXX
Com a nom de visualització jo posaria PMID
o creus que caldria afegir entre parèntesi (PubMed)???
Tasques relacionades 2 (0 obertes — 2 tancades)
FJ Actualitzat per Ferran Jorba fa quasi 12 anys
Personalment, jo no hi posaria aquest aclariment entre parèntesi, perquè tampoc no li posem a altres etiquetes (DOI, ISSN, ISBN, etc.). Qui sap què és, ja ho entén, i qui no, no crec que li molesti tant, o tampoc no necessàriament ha de saber què és això de PubMed.
Pel que fa a la URL, he vist que encara es pot abreujar una miqueta més; per exemple:
CA Actualitzat per Cristina Azorin fa quasi 12 anys
Perfecte, t'ho compro tot :-)))
Quan estigui tanca la tasca.
CA Actualitzat per Cristina Azorin fa més de 10 anys
- Categoria s'ha establert a Suport a docència i recerca
- Estat ha canviat de Creada a En curs
- Paraula clau s'ha establert a JR
De moment s'està recollint aquest identificador als registres però apareix de formes diferents i s'hauria de comprovar:
024 8_ $9 pmid $a 19792103
024 8_ $9 driver $9 artpubuab $a 19117952 $z pmid
Però no és visible en els registres.
És podria afegir abans o després del DOI??
Exemple:
- https://ddd.uab.cat/record/128639 (https://ddd.uab.cat/record/128639/export/hm?ln=ca)
- https://ddd.uab.cat/record/118326 (https://ddd.uab.cat/record/118326/export/hm?ln=ca)
CA Actualitzat per Cristina Azorin fa aproximadament 10 anys
- Data de venciment s'ha establert a 18-12-2016
CA Actualitzat per Cristina Azorin fa quasi 10 anys
- Prioritat ha canviat de Normal a Alta
FJ Actualitzat per Ferran Jorba fa quasi 10 anys
També caldria qe aparegués en els registres en html pels cercadors, com a PubMed IDs
citation_pmidCA Actualitzat per Cristina Azorin fa més de 9 anys
- Assignat a ha canviat de Ferran Jorba a Javier Planella
La primera actuació a fer seria cercar tots els articles amb DOI del DDD a PubMed Central i carregar el seu PMID al DDD. Per exemple, hem fet aquesta cerca: http://www.ncbi.nlm.nih.gov/pubmed/?term=10.1091%2Fmbc.E07-04-0334
CA Actualitzat per Cristina Azorin fa més de 9 anys
si l'identificador es pot posar automàticament perfecte i seguim amb la tasca però les biblioteques no completaran els registres manualment. (Reunió DiR 14/07/2016)
CA Actualitzat per Cristina Azorin fa més de 9 anys
- Prioritat ha canviat de Alta a Normal
JP Actualitzat per Javier Planella fa més de 9 anys
programa python programado: doi2pmid.py
de momento solo comprueba todos los articulos con DOI en DDD:6040 records to fix
JP Actualitzat per Javier Planella fa més de 9 anys
NCBI provee de una serie de API para acceder a sus bases de datos
(https://www.ncbi.nlm.nih.gov/home/develop/api.shtml)
en el directorio ddd@mompou:~/download/pubmed/edirect estan descargadas las "e-utilities".
A traves de ellas es posible obtener el pmid desde el numero DOI.
Por ejemplo si queremos el pmid de https://www.ncbi.nlm.nih.gov/pubmed/?term=10.1074%2Fjbc.M806173200:
./esearch -db pubmed -query "10.1074/jbc.M806173200" | ./efetch -format docsum|./xtract -pattern DocumentSummary -element Id
retorna 19117952
JP Actualitzat per Javier Planella fa més de 9 anys
En la pagina: https://www.ncbi.nlm.nih.gov/pmc/pmctopmid/ indica:
"Another option for obtaining PMIDs and DOIs for article in PMC is to download an identifier cross-reference file from our FTP site, as documented in the FTP Service page."
que enlaza a la pagina: https://www.ncbi.nlm.nih.gov/pmc/tools/ftp/#Obtaining_DOIs y dice:
"...
The top level directory for the service contains a set of file lists to be used when retrieving files from the three open access directories.
The base URL of the FTP site is ftp://ftp.ncbi.nlm.nih.gov/pub/pmc
..."
y en esa dirección FTP "ftp://ftp.ncbi.nlm.nih.gov/pub/pmc/" esta el fichero "PMC-ids.csv.gz" que contiene entre otros valores el DOI y el PMID:
Journal Title,ISSN,eISSN,Year,Volume,Issue,Page,DOI,PMCID,PMID,Manuscript Id,Release Date
Breast Cancer Res,1465-5411,1465-542X,2000,3,1,55,,PMC13900,11250746,,live
Proc Natl Acad Sci U S A,0027-8424,1091-6490,2000,98,1,87,10.1073/pnas.98.1.87,PMC14549,11134513,,live
...
descargamos ese fichero el dia 18 de cada mes, en el crontab:
Tasques mensuals
00 01 1 * * /bin/monthly.sh
18 18 18 * * /bin/getpmids.sh
y lo descarga en ~/var/lib/pubmed/PMC-ids.csv
el fichero python con la programacion para añadir el PMID es: doi2pmid.py
En fecha 5 de octubre quedan 5633 registros por actualizar
JP Actualitzat per Javier Planella fa més de 9 anys
Añadido "doi2pmid" al fichero: ~/bin/hourly_weekend.sh para que se ejecute los fines de semana
JP Actualitzat per Javier Planella fa més de 9 anys
eliminado "doi2pmid" de
~/bin/hourly_weekend.sh
~/bin/daily.sh
y añadido a
~/bin/monday.sh
"...tenim tots els dois que no són (ni seran mai) de medicina, i que
mai no estaran en el PubMed (filologia, geologia, enginyeries, etc.).
Per tant, sempre tindràs molts candidats. Com que això és així,
potser valdria la pena passar el script de diari a setmanal, perquè
llegir 5000, 6000 o cada vegada més milers de registres cada dia de la
base de dades en format Marc és molt costós i triga molta estona. Per
exemple, el treus del daily.sh i el passes a monday.sh. ..."
"...Si tens 6.000 registres candidats, els has de llegir un a
un per veure si pròpiament se li ha d'afegir la 024. I aquesta
quantitat anirà augmentant, perquè cada cop tenim més dois. Fer la
lectura cada dia d'aquests candidats, entenc jo, és excessiu per la
poca quantitat de pmids que hi afegirem. Crec que amb un cop a la
setmana n'hi hauria d'haver prou..."
JP Actualitzat per Javier Planella fa més de 9 anys
- Assignat a ha canviat de Javier Planella a Ferran Jorba
hay 5587 candidatos, pero no se actualiza ningun registro del DDD porque:
"Ferran dice .... molt probablement, el que passa és que no hi ha nous registres amb doi
que també estiguin a la versió actual del fitxer d'equivalències entre
dois i pmids que ens baixem un cop al mes. Recorda que només tenen
pmid si són articles de l'àmbit de medicina. Segurament aquesta
setmana no n'ha entrat cap de nou. D'altra banda, també podria ser
que la propera vegada que s'actualitzi el fitxer d'equivalències, el
programa n'afegeixi a articles que ara mateix no en tenen"
"... cal que aparegui en la visualització HTML, i també, tal com diu la nota #6, en les metadades de Google
Scholar. "
Falta la parte de visualizacion que hará Ferran Jorba
CA Actualitzat per Cristina Azorin fa més de 9 anys
- Data de venciment ha canviat de 18-12-2016 a 23-12-2016
- Prioritat ha canviat de Normal a Alta
CA Actualitzat per Cristina Azorin fa aproximadament 9 anys
- Paraula clau s'ha suprimit (
JR)
CA Actualitzat per Cristina Azorin fa aproximadament 9 anys
- Data de venciment ha canviat de 23-12-2016 a 01-06-2017
- Paraula clau s'ha establert a JR
FJ Actualitzat per Ferran Jorba fa aproximadament 9 anys
- Estat ha canviat de En curs a Tancada
Ja s'hi veu, p. ex:
CA Actualitzat per Cristina Azorin fa aproximadament 9 anys
- Prioritat ha canviat de Alta a Normal
CA Actualitzat per Cristina Azorin fa aproximadament 8 anys
- Paraula clau s'ha suprimit (
JR)