Tasca #3249
tancatTasca #3268: Objectius i tasques per fer a casa en teletreball (Ferran)
Detectar, corregir o eliminar els PDFs duplicats de les tesis. Repassar els drets
Descripció
A partir de la càrrega de tesis del TDX que no estaven al DDD (#3010) he detectat que hi ha un munt de PDFs duplicats i/o orfes, potser degut al canvi d'identificador (de l'antic TDX al nou handle de Recercat). Concretament tinc detectsts 139 fitxers, corresponent a 123 tesis.
Cal fer un diagnosi i fer neteja, procurant que no faci malbé les estadístiques.
Tasques relacionades 3 (0 obertes — 3 tancades)
FJ Actualitzat per Ferran Jorba fa aproximadament 11 anys
- S'ha actualitzat Descripció (diferències)
CA Actualitzat per Cristina Azorin fa aproximadament 11 anys
Ferran, em sembla que hi ha un problema greu en l'assignació de les llicències al DDD. Em sembla que surten totes amb els drets reservats i la nota de tesis antiga del TDX quan ara la majoria tenen llicències Creative commons.
Exemple:
- al DDD: http://ddd.uab.cat/record/129862
- a TDX: http://www.tdx.cat/handle/10803/286076
En aquest cas la llicència i el text està bé, però el logo no:
- al DDD: http://ddd.uab.cat/record/129854 o http://ddd.uab.cat/record/129855
CA Actualitzat per Cristina Azorin fa aproximadament 11 anys
- Tema ha canviat de Detectar, corregir o eliminar els PDFs duplicats de les tesis a Detectar, corregir o eliminar els PDFs duplicats de les tesis. Repassar els drets
FJ Actualitzat per Ferran Jorba fa aproximadament 11 anys
Cristina Azorin va escriure:
Ferran, em sembla que hi ha un problema greu en l'assignació de les llicències al DDD. Em sembla que surten totes amb els drets reservats i la nota de tesis antiga del TDX quan ara la majoria tenen llicències Creative commons.
Li estic donant voltes, en el cas del TDX i dels OJS (al menys del ReDI) i em sembla molt que sempre serà liós si continuem en aquesta línia, de fer-ho tot alhora. En la 520 hi tenim tres subcamps, els dos primers codificats
- $9 codi per a Europeana, Drivier i similars (info:eu-repo/semantics/openAccess i etc), especialment rellevant per la sortida Dublin Core via OAI per complir les especificacions europees.
- $u amb la URL de la llicència, en general la de Creative Commons però també dues d'Europeana (accés lliure, accés restringit i domini públic)
- $a el text desenvolupat del $u (quan és CC o domini públic) o específic en els altres dos casos, de vegades a partir del $9 (ex: quan és accés resringit).
Aleshores, coordinar els tres és complicat, especialment quan la informació ve d'origens diferents (formularis, OAI, càrregues puntuals, etc).
Per tant, estic pensant de que en una primera fase (en el moment de crear registres nous, vinguin d'on vinguin) es creï només el $9 i el $u i el $a es faci després, a partir dels altres dos camps codificats.
FJ Actualitzat per Ferran Jorba fa aproximadament 11 anys
- Estat ha canviat de Creada a En curs
M'ho he estat mirant i entenc que no hauria d'afectar les estadístiques, ja que les estadístiques es van generant a mesura que hi ha els accessos.
El que he fet és apartar tots els directoris on hi ha fitxers duplicats perquè ja no estiguin en el CLARIION, i demà faré una segona comprovació que hi hagi consistència entre els fitxers i els registres.
FJ Actualitzat per Ferran Jorba fa quasi 11 anys
- Tasca pare s'ha establert a #3268
CA Actualitzat per Cristina Azorin fa quasi 11 anys
Aquesta tasca ja recull el repàs dels drets, hem trobat alguns exemples de registres mal codificats:
- https://ddd.uab.cat/record/128735
CA Actualitzat per Cristina Azorin fa més de 10 anys
Un altre exemple amb els drets malament:
CA Actualitzat per Cristina Azorin fa més de 10 anys
- Paraula clau s'ha establert a JR
FJ Actualitzat per Ferran Jorba fa més de 10 anys
- Categoria s'ha establert a Gestió de la col·lecció
- Assignat a ha canviat de Ferran Jorba a Cristina Azorin
A partir d'ara el programa de càrrega ja mira si hi ha una urls (de drets) al camp de drets i el posa al $u, de manera que sortirà la icona correcta.
Els antics els corregirà la UTP a base de canvis globals.
CA Actualitzat per Cristina Azorin fa més de 10 anys
No se perquè però hi ha 79 que encara no s'han arreglat...
CA Actualitzat per Cristina Azorin fa més de 10 anys
- Estat ha canviat de En curs a Tancada
Ja està tot correcte, tanquem la tasca.
CA Actualitzat per Cristina Azorin fa més de 10 anys
- Paraula clau s'ha suprimit (
JR)