Tasca #2084
tancatTasca #2055: Projectes Digitalització: MCU-OAI 2012
Metadades EDM, Skos, ORE
Descripció
Millores en el DDD: adaptació dels estandars Europeana (EDM, control d'autoritats, descripció contextual i protocols d'intercanvi de dades)¶
En la present convocatòria del Ministerio de Cultura, a l'igual que en l'anterior, la concessió dels ajuts ve determinada per l'adaptació de les descripcions resultants a l'Europeana Data Model.
Per aquest motiu, dins la proposta d'ajuts es va incloure una partida destinada a l'anàlisi del software i la seva configuració, així com les possibilitats d'afegir metadades d'autoritats i matèries aprofitant el marc normatiu que ja emprem en les nostres eines de descripció (catàleg i altres bases de dades, inclòs el dipòsit digital).
Fent un breu resum de les directrius d'Europeana podriem dir que els requeriments que pretén assolir van en tres direccions principals (vegeu nota al final):
1. Distingir entre l'objecte real i l'objecte digital: l'anterior model d'Europeana (ESE) no va aconseguir normalitzar la distinció de les metadades de l'objecte (considerant com a tal l'obra intel·lectual, bé sigui bibliogràfica o documental, be sigui física -peça arqueològica, quadre, etc.) i la seva representació digital. Les metadades sobre drets, agregadors, dipositari, ubicació, forma, etc., han de quedar clarament diferenciades. De la mateixa forma, cal garantir també l'accés a objectes digitals compostos i fins i tot diseminats (diferents representacions que fan referència a una mateixa obra).
2. Compatibilitat entre diferents nivells de descripció i reutilització d'estandars: el model EDE contempla etiquetes pròpies com EDM:webresource, EDM:ProvidedCHO, EDM:Agent, etc.; i d'altres que ja provenen d'estandars acceptats, com les Dublin Core, ORE, OWL, RDA o SKOS. El mapatge, doncs, presenta la complexitat de la multiplicitat però la flexibilitat d'adaptació en cas de seguir models normalitzats com és el nostre cas (Dublin Core, Març 21, etc.)
3. Ús de protocol d'intercanvi de dades OAI (desitjable OAI-ORE)
Per tal de dur a terme aquest propòsit, l'estructura de metadades es representa en 7 clases dividides en dos grups:
CORE
en la que es fa la distinció entre l'objecte real i la seva representació digital + l'agregació que els ajunta
- Objecte real: edm:ProvidedCHO (amb cos d'etiquetes dc, rdf i edm)
- Representació digital: edm:WebResource (dc i edm:rights)
- Agregació que els uneix: ore:Aggregation (etiquetes ore, edm i dc:rights)
Contextuals
que, teòricament, han de permetre gran part d'aquesta gran "idea conceptual" del núvol semàntic. Dins aquest gran grup de descripció de metadades conceptuals trobem etiquetes de molts estandars com owl, dc, foaf, rda...
- Qui (edm:Agent)
- On (edm:Place)
- Quan (edm:TimeSpan)
- Qué (skos:Concept)
Nota: aquest resum l'elaborat a partir de les conclusions que he anat traient de la lectura de diferents informes d'Europeana. Valoreu-lo només a com a interpretació personal i primera aproximació als requeriments EDM, del tot discutible i esperem que àmpliament millorable entre tots.
BP Actualitzat per Beatriu Piera fa més de 13 anys
Informe d'adaptació a Europeana Data Model¶
Tal i com s'ha indicat en la descripció d'aquesta tasca (vegeu també #2055 com a tasca pare per tenir accés a com s'ha repartit el pressupost), d'igual forma que han fet altres institucions que participen en els projectes subvencionats del Ministerio (inclòs el CBUC), el SdB de la UAB va plantejar una partida pressupostària destinada a l'elaboració d'un informe d'adaptació del CDS Invenio al model de metadades proposat pel Ministerio (agregador d'Europeana).
Aquest treball s'ha encarregat a l'empresa valenciana MasMedios, experts en repositoris i que actualment son els que han guanyat el concurs per adaptar Travesía (dipòsit institucional del MECU) a Europeana.
Entre juliol i novembre (dates entre la solicitud dels ajuts i la reunió prèvia a l'inici dels treballs amb Masmedios) es van produir alguns canvis i publicació de treballs (tant de la Comissió d'Europeana com del Ministerio, Fundación Ignacio Larramendi i CBUC) que han fet variar les nostres necessitats quan assessorament extern. Del plantejament d'un informe-diagnòstic inicial hem virat cap a la formació i implementació, saltant-nos aquest pas previ, ja que hem considerat que gran part de l'anàlisi es pot assumir internament.
Amb aquest plantejament la Núria Casaldàliga i jo mateixa, vam tenir una trobada "informal" a Barcelona amb l'Alícia Sellés, tècnica de MasMedios que portarà el nostre projecte i vam posar sobre la taula una nova proposta de treball més oberta:
- Analitzar CDS-Invenio en la seva versió instal·lada a la UAB i amb les característiques que en Ferran Jorba ha anat desenvolupant durant aquests anys. En l'entorn en que ens trobem en aquests moments això significa fer l'anàlisi sobre la nova versió del programari que ja s'està instal·lant, així com en un entorn de proves que el reflecteixi (no te sentit treballar d'una altra manera).
- Fins on podem arribar sense tocar estructura? De comú criteri considerem que no és convenient tocar o modificar el programari per adaptar-nos a les metadades EDM
- On volem arribar? Ja no només On Podem, sinó també On estem disposats. Pensem que la introducció d'algunes metadades, especialment les contextuals, suposaran canvis en les feines d'alimentació del dipòsit i és necessari que aquests esforços estiguin justificats.
- La introducció de noves metadades suposarà avantatges? Hem de mirar cap el futur, no tapar l'expedient perquè ens ho demana una altra institució.
- Aquests canvis aporten benefici professional? Cal que tot això es faci amb personal ben format que conegui aquest entramat de metadades i que pugui desenvolupar la seva feina amb comoditat, interpretant uns resultats visibles de la seva feina (una única introducció de dades amb qualitat = múltiples canals d'explotació). Un esforç com aquest cal que sigui comprès per tots els qui hi participen.
- Fins on podrem arribar en una implementació real? Volem aprofitar al màxim tot el coneixement que es generi de la col·laboració amb Masmedios per dur-ho a l'entorn real del DDD i futurs desenvolupaments que es puguin generar. Creiem que podem anar més enllà de pagar per un diagnòstic.
- Qui fa què? Sentar les bases des de l'inici de quines son aquelles parts de la implementació que hem de desenvolupar nosaltres i quines són responsabilitat d'altres institucions de tipus nacional: Biblioteca de Catalunya, Nacional i MECU. No hem de ser més papistes que el papa i, a més, tenim la gran oportunitat de treballar amb una empresa que ara mateix té accés a les "interioritats" dels que han de prendre decisions en aquest sentit.
Per definir tot això i tenint en compte, com ja he indicat abans, que en Ferran està totalment immers en la implementació de la nova sessió, hem quedat amb la tècnica de Masmedios per fer una trobada virtual entre l'empresa, l'SI i la UTP per definir quin serà el nostre projecte a desenvolupar entre els mesos de gener a juliol de 2012. Les conclusions d'aquesta primera reunió donaran lloc a l'elaboració del pressupost definitiu i el conseqüent inici de la col·laboració entre Masmedios i el SdB de la UAB.
BP Actualitzat per Beatriu Piera fa aproximadament 13 anys
- Estat ha canviat de En curs a Cal més informació
Es paralitza aquest projecte perquè va lligat a una subvenció (pre-concedida però no ingressada per motius pressupostaris de l'Estat):
_Llei orgànica 2/2012, de 27 d’abril, d’estabilitat pressupostària i sostenibilitat financera.
Article 20.3.
En els supòsits d’incompliment de l’objectiu d’estabilitat pressupostària, de deute públic o de la regla de despesa, la concessió de subvencions o la subscripció de convenis per part de l’Administració central amb comunitats autònomes incomplidores necessita, amb caràcter previ a la seva concessió o subscripció, informe favorable del Ministeri d’Hisenda i Administracions Públiques._
CA Actualitzat per Cristina Azorin fa aproximadament 13 anys
Blok de BiD 20 de març de 2013
La publicació l'octubre de 2011 de l'Informe Final del W3C Library Linked Data Incubator Group va definir amb nitidesa les pràctiques i els objectius que havien de seguir les biblioteques (i els arxius i els museus) amb el propòsit de fer disponibles els seus conjunts de dades. No obstant això, aquest Informe Final no baixava al detall, ja que es tractava de recomanacions de caràcter genèric. Per això és tan important la publicació, ja en la seva versió 2.0, de les LODE-BD Recommendations preparada per l'Imma Subirats i per la Marcia Lei Zeng.
Un quart capítol està dedicat als passos que s'han de donar, una vegada que s'han establert els procediments per a la publicació de les dades en LOD. S'enumeren opcions d'implementació, s'explica com s'han de publicar i utilitzar les dades vinculats i on es troben els conjunts de dades i vocabularis de valors a Linked Data, superats ja els dos documents que es van publicar conjuntament amb l'informe final a la ja esmentada data del 25 octubre de 2011.
L'informe es tanca amb una sèrie d'apèndixs que recorren la història del propi document, expliquen de manera molt clara la terminologia i recullen els estàndards de metadades utilitzats en l'informe. Al meu entendre l'apèndix amb què es tanca el document és especialment útil perquè estableix un crosswalk entre les metadades utilitzats en LODE-BD i en schema.org. Potser no estigui de més recordar que schema.org és el punt de trobada i d'acord al que han arribat els grans cercadors Google, Bing i Yahoo i la implementació en la interfície de recuperació de qualsevol sistema automatitzat és beneficiadíssima.
En resum, un autèntic vademecum caracteritzat pel seu enfocament eminentment pràctic, sense que per això en cap moment es perdi el rigor ni s'abandoni el propòsit d'una exhaustivitat que veritablement resulta admirable si es té present que el document té 52 pàgines.
Es tracta, doncs d'un instrument de treball extraordinàriament útil per a qui tingui el propòsit, i aquest qui hauria d'abastar pràcticament a tota la professió, de publicar en Linked Open Data les seves dades bibliotecàries (i arxivístiques i museològiques). L'indubtable èxit d'Europeana, que ha superat ja els 25 milions d'objectes digitals, utilitzant una estructura, l'Europeana Data Model, que participa plenament dels principis del W3C Library Linked Data Incubator Group es veurà sens dubte fortament ratificat a partir del dia 18 d'abril amb el llançament de la Digital Public Library of America l'última versió del seu perfil d'aplicació està fortament basada en EDM, fins i tot utilitzant una part considerable del seu model de dades.
El document que es ressenya es basa en una estructura summament clara, doncs després d'unes recomanacions de caràcter general i d'un repàs als esquemes de metadades més importants, desplega una sèrie d'arbres de decisions a partir dels quals és possible establir propostes per les propietats individuals. Així, es proporcionen arbres per informació sobre el títol, per l'entitat responsable, diferenciant entre creador, contribuïdor i editor, per a les característiques físiques, per a la informació sobre els exemplars i la seva localització, i, per descomptat, i en un panorama RDA, que començarà a fer-se notar justament el proper 1 d'abril, amb les condicions de la disponibilitat.
També s'analitza el flux de decisions sobre l'assignació de matèries, la descripció del contingut, els drets de propietat intel·lectual i d'ús, deixant l'última anàlisi per a les relacions que es poden establir entre diferents recursos i entre diferents agents.
CA Actualitzat per Cristina Azorin fa quasi 12 anys
Tinc el material d'un curs de la SEDIC sobre metadades per si ens interessa en el futur:
"Como lo prometido es deuda, os envio el material del curso de Metadatos que hice en la Sedic. La dirección web del curso, para que veais el temario es: http://www.sedic.es/f_cursosvirtuales-14-2tr8.asp"
CA Actualitzat per Cristina Azorin fa quasi 11 anys
CA Actualitzat per Cristina Azorin fa més de 10 anys
- Categoria s'ha establert a Gestió de la col·lecció
CA Actualitzat per Cristina Azorin fa aproximadament 7 anys
- Estat ha canviat de Cal més informació a Tancada
ja hem implementat el format EDM al DDD, tanco la tasca.