Projecte

General

Perfil

Accions

Tasca #6790

tancat
FJ FJ

Netejar, actualitzar i polir l'articleid

Tasca #6790: Netejar, actualitzar i polir l'articleid

Afegit per Ferran Jorba fa aproximadament 4 anys. Actualitzat fa aproximadament 3 anys.

Estat:
Tancada
Prioritat:
Normal
Assignat a:
Categoria:
Tecnologia
Inici:
31-01-2022
Data de venciment:
22-12-2022
Paraula clau:

Descripció

El camp 035 article id és un camp propi del DDD (i de Traces) que serveix (i, sobretot, va servir al començament) per detectar i evitar duplicats d'articles de revista. Es construeix a partir dels camps ISSN (sense guió), volum (quan hi és), número (si hi és) i primera pàgina, com per exemple:

20148860v28p299
20139004v106n3p357
20147910v9n2p179
18858996v26n1p168

Quan funciona bé, serveix i fa la seva feina, però ara mateix de vegades no. Això passa sobretot en articles en premsa (en els quals no se'ls hi ha assignat volum, número o pàgina), o en articles sense pàgina (o que no la sabem). Per exemple, avui m'he fixat que no ha entrat cap article de Pubmed perquè Invenio es trobava amb 035 duplicades com a articleid, i és perquè són incomplets, p. ex:

16641078v12np
18783511vnp
14786362v24np
18746365vnp1

Resulta que aquests articleids, que òbviament es veu que són incomplets, ja els tenim carregats al DDD, i si hi ha més articles que s'haurien d'importar i que també els tenen, no es carreguen.

Algun cop ha passat també amb un articleid ben generat d'una carta a la secció de cartes d'una revista on en teniem més d'una amb el mateix issn, volum, número i pàgina.

Diria que d'entrada no s'hauria de generar si no té ni volum ni número, o si no té pàgina o la pàgina és la 1. També s'hauria d'esborrar els articleids que tenim als registres que compleixin aquesta condició.

Accions

També disponible a: PDF Atom