Servidor OAI¶
Vegeu també: OAIsetsQueExportaElDDD ServidorOAIdeRecercat
El servidor OAI (Open Access Initiative Metadata Harvesting Protocol) ens ha de servir que des de clients OAI remots (ex., RACO) ens puguin "copiar" les metadades automàticament, i no hagueu de repetir la catalogació dos cops. (Pel que fa a RACO, com que encara no disposa del client OAI operatiu, hem obert una pàgina específica a ExportarARACO.)
La documentació en Invenio la tenim a http://ddd.uab.cat/admin/bibharvest/guide.html. També cal completar-lo amb el fitxer de configuració (còpia local a QuePermetCanviarElFitxerDeConfiguracio, secció 6: BibHarvest OAI parameters.
M'estic estudiant un tutorial (http://www.oaforum.org/tutorial/) per a entendre què hi he de posar a cada camp. He descobert que, d'alguna manera, el servidor ja funciona sol quan s'instal·la l'Invenio, però que si no el configures no dóna cap informació útil. Vegem què contesta per a cadascun dels 6 verbs [http://www.openarchives.org/OAI/openarchivesprotocol.html#ProtocolMessages] del estàndard OAI:
- http://ddd.uab.cat/oai2d?verb=GetRecord [http://www.openarchives.org/OAI/openarchivesprotocol.html#GetRecord]
- http://ddd.uab.cat/oai2d?verb=Identify [http://www.openarchives.org/OAI/openarchivesprotocol.html#Identify]
- http://ddd.uab.cat/oai2d?verb=ListMetadataFormats [http://www.openarchives.org/OAI/openarchivesprotocol.html#ListMetadataFormats]
- http://ddd.uab.cat/oai2d?verb=ListSets [http://www.openarchives.org/OAI/openarchivesprotocol.html#ListSets]
- http://ddd.uab.cat/oai2d?verb=ListIdentifiers [http://www.openarchives.org/OAI/openarchivesprotocol.html#ListIdentifiers]
- http://ddd.uab.cat/oai2d?verb=ListRecords [http://www.openarchives.org/OAI/openarchivesprotocol.html#ListRecords]
Hi ha més informació a la llista a partir de les meves preguntes. Consulteu els fils següents:
- http://cdsware.cern.ch/lists/project-cdsware-users/archive/msg01043.shtml
- http://cdsware.cern.ch/lists/project-cdsware-users/archive/msg01054.shtml
En els registres del DDD el set OAI es marca a l'etiqueta 024 8_ juntament amb l'identificador.
Quan es produeix l'exportació el nom del set apareix en un $9, però quan s'ha eliminat el registre d'aquest set apareix en un $z dins de la mateixa etiqueta.
----
Comencem. Fem un inventari dels 6 verbs, mirem exemples, i determinem què hi hem de posar. Evidentment, si teniu més exemples, millor. Al directori de http://celestial.eprints.org/ n'hi ha prop de mil.
1. GetRecord¶
Què és i per què serveix:
- http://www.oaforum.org/tutorial/english/page3.htm#section4
- http://www.openarchives.org/OAI/openarchivesprotocol.html#GetRecord
Exemples de diferents resultats del verb Identify a diferents dipòsits:
- http://ddd.uab.cat/oai2d?verb=GetRecord&metadataPrefix=oai_dc&identifier=oai:ddd.uab.cat:20704
- http://ddd.uab.cat/oai2d?verb=GetRecord&metadataPrefix=ese&identifier=oai:ddd.uab.cat:20704
- http://ddd.uab.cat/oai2d?verb=GetRecord&metadataPrefix=marcxml&identifier=oai:ddd.uab.cat:20704
- http://oai.recercat.net/request?verb=GetRecord&metadataPrefix=oai_dc&identifier=oai:www.recercat.cat:2072/2075
- http://oai.recercat.net/request?verb=GetRecord&metadataPrefix=qdc&identifier=oai:www.recercat.cat:2072/2075
- http://oai.recercat.net/request?verb=GetRecord&metadataPrefix=marc&identifier=oai:www.recercat.cat:2072/2075
- http://oai.recercat.net/request?verb=GetRecord&metadataPrefix=rdf&identifier=oai:www.recercat.cat:2072/2075
- http://oai.recercat.net/request?verb=GetRecord&metadataPrefix=mets&identifier=oai:www.recercat.cat:2072/2075
- http://oai.recercat.net/request?verb=GetRecord&metadataPrefix=didl&identifier=oai:www.recercat.cat:2072/2075
2. Identify¶
Què és i per què serveix:
- http://www.oaforum.org/tutorial/english/page3.htm#section4
- http://www.openarchives.org/OAI/openarchivesprotocol.html#Identify
Què hi hem de configurar, obligatòriament [http://cdsware.cern.ch/lists/project-cdsware-users/archive/msg01044.shtml]:
- Com volem que siguin els identificadors OAI. Els identificadors són habitualment de l'estil ``oai:adreçadelrepositori:id``. En el nostre cas, crec que ens interessa així: ``oai:ddd.uab.cat:recid``, on recid és l'etiqueta 001. Crec que ens convé l'etiqueta 001 perquè no tenim cap altre identificador únic.
- Està bé que sigui ``oai:ddd.uab.cat:recid`` (CristinaAzorin)
- A quina etiqueta MARC volem guardar aquest identificador únic OAI. Aquest identificador es crea automàticament per l'eina oaiarchive [http://cdsware.cern.ch/lists/project-cdsware-users/archive/msg01044.shtml] [http://ddd.uab.cat/admin/bibharvest/guide.html#3.2] i l'ha de guardar en una etiqueta MARC per així saber que el registre ja està exportat.
- La mateixa que el CERN, 024.8_$a, que és MARC21 [http://www.loc.gov/marc/bibliographic/ecbdnumb.html#mrcb024] (CristinaAzorin)
- A quina etiqueta hi guardarem l'identificador de OAI set (l'equivalent a les col·leccions per als conjunts OAI [http://cdsware.cern.ch/lists/project-cdsware-users/archive/msg01047.shtml]).
- 024.8_ $9
Què hi podem determinar, opcionalment:
- Les polítiques [http://www.openarchives.org/OAI/openarchivesprotocol.html#Identify]. En el cas de la versió 0.92.1 d'Invenio, això es posa al fitxer de configuració general (vegeu: QuePermetCanviarElFitxerDeConfiguracio).
Exemples de diferents resultats del verb Identify a diferents dipòsits:
- http://ddd.uab.cat/oai2d?verb=Identify
- http://cdsweb.cern.ch/oai2d?verb=Identify
- http://doc.rero.ch/oai2d.py?verb=Identify
- http://infoscience.epfl.ch/oai2d.py?verb=Identify
- http://www.raco.cat/index.php/index/oai/?verb=Identify
- http://www.tdx.cesca.es/TDX_UAB/NDLTD-OAI/oai.pl?verb=Identify
- http://mdc.cbuc.cat/cgi-bin/oai.exe?verb=Identify
- http://oai.recercat.net/request?verb=Identify
- http://dspace.mit.edu/dspace-oai/request?verb=Identify
- http://eprints.soton.ac.uk/perl/oai2?verb=Identify
3. ListMetadataFormats¶
Què és i per a què serveix:
- http://www.oaforum.org/tutorial/english/page3.htm#section4
- http://www.openarchives.org/OAI/openarchivesprotocol.html#ListMetadataFormats
Aquest és fàcil perquè ens ve donat per l'aplicació: exportem MARCXML i DublinCore:
- http://ddd.uab.cat/oai2d?verb=ListMetadataFormats
- http://cdsweb.cern.ch/oai2d?verb=ListMetadataFormats
- http://doc.rero.ch/oai2d.py?verb=ListMetadataFormats
- http://infoscience.epfl.ch/oai2d.py?verb=ListMetadataFormats
- http://www.raco.cat/index.php/index/oai/?verb=ListMetadataFormats
- http://www.tdx.cesca.es/TDX_UAB/NDLTD-OAI/oai.pl?verb=ListMetadataFormats
- http://oai.recercat.net/request?verb=ListMetadataFormats
- http://dspace.mit.edu/dspace-oai/request?verb=ListMetadataFormats
- http://eprints.soton.ac.uk/perl/oai2?verb=ListMetadataFormats
- http://mdc.cbuc.cat/cgi-bin/oai.exe?verb=ListMetadataFormats
4. ListSets¶
Què és i per a què serveix:
- http://www.oaforum.org/tutorial/english/page3.htm#section4
- http://www.openarchives.org/OAI/openarchivesprotocol.html#ListSets
És l'equivalent a les col·leccions però per a exposar-ho via OAI. Jo crec que part de les col·leccions seran conjunts ja definits, però no tots. Per exemple, tots els articles de les revistes publicades a la UAB poden ser un set, però potser ens convé més fer-ho per revista, com RACO? Però per a la Biblioteca Virtual de Premsa Històrica
[http://prensahistorica.mcu.es/prensahistorica/ca/consulta/busqueda.cmd] segurament haurem de restringir col·leccions ja existents, com la de revistes antigues d'art i cultura [http://ddd.uab.cat/collection/raac], només a aquelles que siguin espanyoles, però això només és tal com ho entenc jo (FerranJorba).
En tot cas, jo crec que haurem d'anar definint-ne una a una. Hem de saber què volem exposar via OAI, què no, i per què. Segurament aleshores se'ns aniran aclarint com definim els sets.
Sembla que es puguin fer jeràrquics, i em sembla entendre pels exemples que els diferents elements de la jerarquia se separen amb dos punts (:).
Pel que fa als exemples del TDX, sembla que no sigui un sol repositori amb diferents sets, sinó 9 de diferents, segons Celestial [http://celestial.eprints.org/].
Exemples:
- http://ddd.uab.cat/oai2d?verb=ListSets
- http://cdsweb.cern.ch/oai2d?verb=ListSets
- http://doc.rero.ch/oai2d.py?verb=ListSets
- http://infoscience.epfl.ch/oai2d.py?verb=ListSets
- http://www.raco.cat/index.php/index/oai/?verb=ListSets
- http://oai.recercat.net/request?verb=ListSets
- http://www.tdx.cesca.es/TDX_UAB/NDLTD-OAI/oai.pl?verb=ListSets
- http://dspace.mit.edu/dspace-oai/request?verb=ListSets
- http://eprints.soton.ac.uk/perl/oai2?verb=ListSets
- http://mdc.cbuc.cat/cgi-bin/oai.exe?verb=ListSets
A data 1 d'octubre tenim 12 sets i caldria reorganitzar-los:
| Identificador | setSpec - que surt també al registre | Nom desenvolupat | Què cal fer? |
| 7 | artpubuab | UAB published articles | Eliminar |
| 16 | artpubuabnoredi | UAB articles no REDI | Eliminar |
| 11 | driver | Driver | Mantenir per Recolecta |
| 13 | ec_fundedresources | EC_fundedresources | Canvir de nom setName: OpenAIRE setSpec: openaire |
| 5 | materials_docents | UAB teaching resources | Mantenir per MDX |
| 4 | ppc | Clandestine pol. press | Eliminar |
| 14 | primocentral | Primo Central | Eliminar o reconvertir en 'All' |
| 3 | raac | Old art and culture j. | Eliminar |
| 2 | revuab | UAB Journals | Eliminar |
| 17 | scholar | Research doc.scholar | Mantenir per estadístiques de producció científica |
| 8 | tesisuab | UAB doctoral theses | Mantenir per si fan preservació a Rebiun |
| 12 | uabeuropeana | UAB records Europeana | Mantenir per entrar directament |
Cal crear un set nou que contingui TOTS els registres del DDD.
5. ListIdentifiers¶
Què és i per a què serveix:
- http://www.oaforum.org/tutorial/english/page3.htm#section4
- http://www.openarchives.org/OAI/openarchivesprotocol.html#ListIdentifiers
Em sembla que aquest no l'hem de configurar. Funciona sol a partir de les definicions anteriors.
Exemples:
- http://ddd.uab.cat/oai2d?verb=ListIdentifiers&metadataPrefix=marcxml&set=revuab
- http://ddd.uab.cat/oai2d?verb=ListIdentifiers&metadataPrefix=oai_dc&set=revuab
- http://ddd.uab.cat/oai2d?verb=ListIdentifiers&metadataPrefix=marcxml&set=revuab&from=2007-12-13
- http://ddd.uab.cat/oai2d?verb=ListIdentifiers&metadataPrefix=marcxml&set=revuab&from=2007-12-16
- http://ddd.uab.cat/oai2d?verb=ListIdentifiers&metadataPrefix=marcxml&set=revuab&from=2007-12-30
- http://www.raco.cat/index.php/index/oai/?verb=ListIdentifiers&metadataPrefix=oai_dc&set=faventia:ART
- http://oai.recercat.net/request?verb=ListIdentifiers&metadataPrefix=oai_dc&set=hdl_2072_13171
- http://cdsweb.cern.ch/oai2d?verb=ListIdentifiers&metadataPrefix=marcxml&from=2007-10-15&until=2007-10-30&set=cerncds:FULLTEXT
- http://doc.rero.ch/oai2d.py?verb=ListIdentifiers&metadataPrefix=marcxml&from=2007-10-15&until=2007-10-30&set=preprint
- http://infoscience.epfl.ch/oai2d.py?verb=ListIdentifiers&metadataPrefix=marcxml&from=2007-10-15&&until=2007-10-30&set=article
- http://www.raco.cat/index.php/index/oai/?verb=ListIdentifiers&metadataPrefix=oai_dc&from=2007-01-15&until=2007-10-30&set=Faventia
- http://www.tdx.cesca.es/TDX_UAB/NDLTD-OAI/oai.pl?verb=ListIdentifiers&metadataPrefix=oai_dc&from=2007-01-01&until=2007-02-28&set=All
- http://dspace.mit.edu/dspace-oai/request?verb=ListIdentifiers&metadataPrefix=oai_dc&set=hdl_1721.1_18194&until=2007-10-30
- http://eprints.soton.ac.uk/perl/oai2?verb=ListIdentifiers&metadataPrefix=oai_dc&set=xxxx&until=2007-10-30
- http://mdc.cbuc.cat/cgi-bin/oai.exe?verb=ListRecords&set=fonshistvet&metadataPrefix=qdc
- http://mdc.cbuc.cat/cgi-bin/oai.exe?verb=ListRecords&set=josepvinyal&metadataPrefix=qdc
6. ListRecords¶
Què és i per a què serveix:
- http://www.oaforum.org/tutorial/english/page3.htm#section4
- http://www.openarchives.org/OAI/openarchivesprotocol.html#ListRecords
Em sembla que aquest no l'hem de configurar. Funciona sol a partir de les definicions anteriors.
Exemples:
- http://ddd.uab.cat/oai2d?verb=ListRecords&metadataPrefix=marcxml&set=revuab
- http://ddd.uab.cat/oai2d?verb=ListRecords&metadataPrefix=oai_dc&set=revuab
- http://www.raco.cat/index.php/index/oai/?verb=ListRecords&metadataPrefix=oai_dc&set=faventia:ART&from=2007-01-01&until=2007-12-31
- http://www.raco.cat/index.php/index/oai/?verb=ListRecords&metadataPrefix=marcxml&set=PublicacionsSeccioMatematiques:ART
- http://oai.recercat.net/request?verb=ListRecords&metadataPrefix=oai_dc&set=hdl_2072_13171
- http://cdsweb.cern.ch/oai2d?verb=ListRecords&metadataPrefix=marcxml&from=2007-10-15&until=2007-10-30&set=cerncds:FULLTEXT
- http://doc.rero.ch/oai2d.py?verb=ListRecords&metadataPrefix=marcxml&from=2007-10-15&until=2007-10-30&set=preprint
- http://infoscience.epfl.ch/oai2d.py?verb=ListRecords&metadataPrefix=marcxml&from=2007-10-15&until=2007-10-30&set=article
- http://www.raco.cat/index.php/index/oai/?verb=ListRecords&metadataPrefix=oai_dc&from=2007-01-15&until=2007-10-30&set=Faventia
- http://www.tdx.cesca.es/TDX_UAB/NDLTD-OAI/oai.pl?verb=ListRecords&metadataPrefix=oai_dc&from=2007-01-01&until=2007-02-28&set=All
- http://dspace.mit.edu/dspace-oai/request?verb=ListRecords&metadataPrefix=oai_dc&until=2007-10-30&set=hdl_1721.1_18194
- http://eprints.soton.ac.uk/perl/oai2?verb=ListIdentifiers&metadataPrefix=oai_dc&set=xxxx&until=2007-10-30
- http://mdc.cbuc.cat/cgi-bin/oai.exe?verb=ListRecords&set=fonshistvet&metadataPrefix=oai_dc
- http://mdc.cbuc.cat/cgi-bin/oai.exe?verb=ListRecords&set=fonshistvet&metadataPrefix=qdc
Actualitzat per Cristina Azorin fa més de 8 anys · 7 revisions