Projecte

General

Perfil

Accions

Servidor OAI

Vegeu també: OAIsetsQueExportaElDDD ServidorOAIdeRecercat

El servidor OAI (Open Access Initiative Metadata Harvesting Protocol) ens ha de servir que des de clients OAI remots (ex., RACO) ens puguin "copiar" les metadades automàticament, i no hagueu de repetir la catalogació dos cops. (Pel que fa a RACO, com que encara no disposa del client OAI operatiu, hem obert una pàgina específica a ExportarARACO.)

La documentació en Invenio la tenim a http://ddd.uab.cat/admin/bibharvest/guide.html. També cal completar-lo amb el fitxer de configuració (còpia local a QuePermetCanviarElFitxerDeConfiguracio, secció 6: BibHarvest OAI parameters.

M'estic estudiant un tutorial (http://www.oaforum.org/tutorial/) per a entendre què hi he de posar a cada camp. He descobert que, d'alguna manera, el servidor ja funciona sol quan s'instal·la l'Invenio, però que si no el configures no dóna cap informació útil. Vegem què contesta per a cadascun dels 6 verbs [http://www.openarchives.org/OAI/openarchivesprotocol.html#ProtocolMessages] del estàndard OAI:

  1. http://ddd.uab.cat/oai2d?verb=GetRecord [http://www.openarchives.org/OAI/openarchivesprotocol.html#GetRecord]
  2. http://ddd.uab.cat/oai2d?verb=Identify [http://www.openarchives.org/OAI/openarchivesprotocol.html#Identify]
  3. http://ddd.uab.cat/oai2d?verb=ListMetadataFormats [http://www.openarchives.org/OAI/openarchivesprotocol.html#ListMetadataFormats]
  4. http://ddd.uab.cat/oai2d?verb=ListSets [http://www.openarchives.org/OAI/openarchivesprotocol.html#ListSets]
  5. http://ddd.uab.cat/oai2d?verb=ListIdentifiers [http://www.openarchives.org/OAI/openarchivesprotocol.html#ListIdentifiers]
  6. http://ddd.uab.cat/oai2d?verb=ListRecords [http://www.openarchives.org/OAI/openarchivesprotocol.html#ListRecords]

Hi ha més informació a la llista a partir de les meves preguntes. Consulteu els fils següents:

En els registres del DDD el set OAI es marca a l'etiqueta 024 8_ juntament amb l'identificador.

Quan es produeix l'exportació el nom del set apareix en un $9, però quan s'ha eliminat el registre d'aquest set apareix en un $z dins de la mateixa etiqueta.
----

Comencem. Fem un inventari dels 6 verbs, mirem exemples, i determinem què hi hem de posar. Evidentment, si teniu més exemples, millor. Al directori de http://celestial.eprints.org/ n'hi ha prop de mil.

1. GetRecord

Què és i per què serveix:

Exemples de diferents resultats del verb Identify a diferents dipòsits:

2. Identify

Què és i per què serveix:

Què hi hem de configurar, obligatòriament [http://cdsware.cern.ch/lists/project-cdsware-users/archive/msg01044.shtml]:

  • Com volem que siguin els identificadors OAI. Els identificadors són habitualment de l'estil ``oai:adreçadelrepositori:id``. En el nostre cas, crec que ens interessa així: ``oai:ddd.uab.cat:recid``, on recid és l'etiqueta 001. Crec que ens convé l'etiqueta 001 perquè no tenim cap altre identificador únic.

Què hi podem determinar, opcionalment:

Exemples de diferents resultats del verb Identify a diferents dipòsits:

3. ListMetadataFormats

Què és i per a què serveix:

Aquest és fàcil perquè ens ve donat per l'aplicació: exportem MARCXML i DublinCore:

4. ListSets

Què és i per a què serveix:

És l'equivalent a les col·leccions però per a exposar-ho via OAI. Jo crec que part de les col·leccions seran conjunts ja definits, però no tots. Per exemple, tots els articles de les revistes publicades a la UAB poden ser un set, però potser ens convé més fer-ho per revista, com RACO? Però per a la Biblioteca Virtual de Premsa Històrica

[http://prensahistorica.mcu.es/prensahistorica/ca/consulta/busqueda.cmd] segurament haurem de restringir col·leccions ja existents, com la de revistes antigues d'art i cultura [http://ddd.uab.cat/collection/raac], només a aquelles que siguin espanyoles, però això només és tal com ho entenc jo (FerranJorba).

En tot cas, jo crec que haurem d'anar definint-ne una a una. Hem de saber què volem exposar via OAI, què no, i per què. Segurament aleshores se'ns aniran aclarint com definim els sets.

Sembla que es puguin fer jeràrquics, i em sembla entendre pels exemples que els diferents elements de la jerarquia se separen amb dos punts (:).

Pel que fa als exemples del TDX, sembla que no sigui un sol repositori amb diferents sets, sinó 9 de diferents, segons Celestial [http://celestial.eprints.org/].

Exemples:

A data 1 d'octubre tenim 12 sets i caldria reorganitzar-los:

Identificador setSpec - que surt també al registre Nom desenvolupat Què cal fer?
7 artpubuab UAB published articles Eliminar
16 artpubuabnoredi UAB articles no REDI Eliminar
11 driver Driver Mantenir per Recolecta
13 ec_fundedresources EC_fundedresources Canvir de nom setName: OpenAIRE setSpec: openaire
5 materials_docents UAB teaching resources Mantenir per MDX
4 ppc Clandestine pol. press Eliminar
14 primocentral Primo Central Eliminar o reconvertir en 'All'
3 raac Old art and culture j. Eliminar
2 revuab UAB Journals Eliminar
17 scholar Research doc.scholar Mantenir per estadístiques de producció científica
8 tesisuab UAB doctoral theses Mantenir per si fan preservació a Rebiun
12 uabeuropeana UAB records Europeana Mantenir per entrar directament

Cal crear un set nou que contingui TOTS els registres del DDD.

5. ListIdentifiers

Què és i per a què serveix:

Em sembla que aquest no l'hem de configurar. Funciona sol a partir de les definicions anteriors.

Exemples:

6. ListRecords

Què és i per a què serveix:

Em sembla que aquest no l'hem de configurar. Funciona sol a partir de les definicions anteriors.

Exemples:

Actualitzat per Cristina Azorin fa més de 8 anys · 7 revisions