Projecte

General

Perfil

Accions

Tasca #5311

tancat
FJ FJ

Visualització de l'històric dels registres bibligràfics via web

Tasca #5311: Visualització de l'històric dels registres bibligràfics via web

Afegit per Ferran Jorba fa aproximadament 7 anys. Actualitzat fa més de 5 anys.

Estat:
Tancada
Prioritat:
Normal
Assignat a:
Categoria:
Tecnologia
Inici:
07-03-2019
Data de venciment:
15-06-2020
Paraula clau:

Descripció

Invenio manté l'històric de totes les versions de cadascun dels registres bibliogràfics. La manera que ofereix Invenio per visualitzar-les és a través de l'editor gràfic de registres. La veritat és que és molt farragós i no l'entenem.

Creiem que es pot crear una visualització alternativa fàcilment a base de combinar quatre conceptes i eines ja preexistents.

La idea principal és que en el món informàtic existeix un ecosistema molt ric de control de versions, singularment al voltant de git, l'eina més important. És senzill (i, de fet, ja ho tinc fet) crear un repositori temporal de control de versions git d'un registre a partir de les versions que es poden extreure d'Invenio. Ara mateix l'històric es pot veure via lína de comandes amb tig (https://jonas.github.io/tig/). Hauria de ser senzill utilitzar una eina via web com cgit (https://git.zx2c4.com/cgit/), que també existeix a Debian (https://packages.debian.org/cgit)

FJ Actualitzat per Ferran Jorba fa aproximadament 7 anys Accions #1

  • Paraula clau s'ha establert a JR

CA Actualitzat per Cristina Azorin fa més de 6 anys Accions #2

  • Data de venciment ha canviat de 28-06-2019 a 18-12-2019

CA Actualitzat per Cristina Azorin fa aproximadament 6 anys Accions #3

  • Data de venciment ha canviat de 18-12-2019 a 15-06-2020
  • Paraula clau ha canviat de JR a NC

CA Actualitzat per Cristina Azorin fa aproximadament 6 anys Accions #4

  • Paraula clau ha canviat de NC a NCR

FJ Actualitzat per Ferran Jorba fa quasi 6 anys Accions #5

  • Estat ha canviat de Creada a Tancada

Al final no he fet d'una manera completament diferent al que havia pensat inicialment. No he utilitzat cap de les eines basades en git, tot i que sense la seva existència i veient el seu funcionament, potser no m'hagués plantejat aquesta tasca.

Finalment s'ha tractat de crear un programa per extreure les dades de la taula hstRECORD d'Invenio, descomprimir els registres i passant-los de marcxml a marc normal, completar els camps amb informacions d'aquí i d'allà, i desar-ho en una base de dades sqlite3, bibversions.db. He decidit també de desar les diferències de cada versió respecte a l'anterior, perquè així la consulta sigui més ràpida.

Ara mateix la base de dades ocupa 16 GB, i té més de 3,8 milions de versions de 219.230 registres diferents (perquè inclou els esborrats). Els més antics són del 2010, és a dir, de fa 10 anys!

L'accés es pot fer des de cada registre, al costat del botó d'editar, o directament des de https://ddd.uab.cat/bibversions.py. Avui ho hem publicat també via SB21.

CA Actualitzat per Cristina Azorin fa més de 5 anys Accions #6

  • Paraula clau s'ha suprimit (NCR)
Accions

També disponible a: PDF Atom