Format per a la importació de metadadesi dades a RACO¶
Característiques de l arxiu¶
L'arxiu per a la importació ha de ser de contingut ASCII codificat amb el joc de caràcters UTF-8.
El nom de l'arxiu XML no pot contenir diacrítics i d'altres caràcters (ñ, ç...).
La llargada total de l arxiu és limitada a 175 articles.
Estructura de l'arxiu¶
La descripció de cada sumari d una revista correspon a un conjunt d articles tal com es defineix més endavant:
L'arxiu ha de començar amb <issues> i acabar amb </issues>.
Cada sumari ha de començar amb <issue> i acabar amb </issue>, i es pot compondre de diversos articles, agrupats per seccions.
Cal agrupar els articles segons la secció a la qual pertanyen, <section> i </section>. Si la revista no té seccions, cal utilitzar la general, Articles, com es mostra en el següent exemple:
<section>
<title>Articles</title>
<abrev>ART</abrev>
<article>...</article>
</section>
Cada article ha de començar amb <article> i acabar amb </article>.
El format de l arxiu serà el següent:
<isues>
<issue>
<section>
<title>Nom secció1</title>
<article>...</article>
<article>...</article>
...
</section>
<section>
<title>Nom secció2</title>
<article> </article>
</section>
...
</issue>
<issue>
<section>
<title>Articles</title>
<article>
</article>
<article>
</article>
...
</section>
</issue>
</issues>
Definició dels camps del número (<issue></issue>)¶
Les marques d inici i fi de les dades d'un número són <issue> i </issue>. Aquesta marca d'inici ha de tenir els següents tres atributs:
- identification: indica quin camp del número s utilitza per identificar-lo. El seu valor a RACO ha de ser title .
- published: mostra si s'ha publicat o no. El seu valor pot ser true o false.
- current: indica si és el darrer número. El seu valor pot ser true o false.
Per exemple:
<issue identification="title" published="true" current="false">
Els camps que es poden incloure dins un número són:
|
Descripció |
|
Codificació |
|
Obligatori? |
|
Repetible? |
|
Format |
|
|
Títol |
|
<title></title> |
|
Sí |
|
No |
|
Text |
|
|
Descripció |
|
<description></description> |
|
No |
|
No |
|
Text |
|
|
Volum |
|
<volume></volume> |
|
No |
|
No |
|
Número |
|
|
Número |
|
<number></number> |
|
No |
|
No |
|
Número |
|
|
Any |
|
<year></year> |
|
Sí |
|
No |
|
Número |
|
|
Portada |
|
<cover></cover> |
|
Sí |
|
No |
|
Vegeu el quadre Camps portada |
|
|
Data de publicació |
|
<date_published></date_published> |
|
No |
|
No |
|
Data |
|
|
Accés al text complet |
|
<access_date></access_date> o bé, <open_acces /> |
|
Sí |
|
No |
|
Vegeu el quadre Camps accés text complet |
|
|
Secció |
|
<section></section> |
|
Sí |
|
Si |
|
Vegeu el quadre Camps secció |
|
Camps portada (<cover></cover>)¶
Els camps que ha de tenir la portada són els següents:
|
Descripció |
|
Codificació |
|
Obligatori? |
|
Repetible? |
|
Format |
|
|
Etiqueta |
|
<caption></caption> |
|
Sí |
|
No |
|
Espai en blanc |
|
|
Imatge |
|
<image></image> |
|
Sí |
|
No |
|
href o embeded |
|
La imatge es pot incloure amb dos formats:
- href: fent un enllaç a la URL on està disponible la imatge.
<image>
<href src="http://www.raco.cat/imatges/portada.jpg" mime_type="image/jpeg" />
</image>
- embeded: incrustant la imatge en l'arxiu xml.
<image>
<embed file[[[[name]]]]="portada.jpg" encoding="base64" mime_type="image/jpeg"></embed>
</image>
Camps accés text complet¶
Cal indicar el tipus d accés que ofereix la revista al text complet dels articles inclosos en aquest número:
- Accés obert. Cal usar l etiqueta <open_access/>
- Text embargat segons les Condicions d'accés obert de la revista. És necessari utilitzar l etiqueta <access_date> i indicar la data (en format AAAA-MM-DD) a partir de la qual serà accessible el text complet. Exemple:
<access_date>2007-11-01</access_date>
Camps secció (<section></section>)¶
Els camps que ha de contenir una secció són els següents:
|
Descripció |
|
Codificació |
|
Obligatori? |
|
Repetible? |
|
Format |
|
|
Títol |
|
<title></title> |
|
Sí |
|
No |
|
Títol de la secció ja existent a la revista |
|
|
Abreviatura |
|
<abrev></abrev> |
|
No |
|
No |
|
Abreujament de la secció |
|
|
Articles |
|
<article></article> |
|
Sí |
|
Sí |
|
Vegeu quadre Camps article |
|
Exemple:
<section>
<title>Articles</title>
<abrev>ART</abrev>
<article>
...
</article>
<article>
...
</article>
</section>
Si voleu definir seccions per a la revista, poseu-vos en contacte amb l oficina del CBUC.
Exemple número:¶
<issues>
<issue identification="title" published="true" current="false">
<title>Núm.: 1 </title>
<volume>0</volume>
<number>1</number>
<year>1997</year>
<cover>
<caption> </caption>
<image>
<href src="http:/cbuc.es/img/portada.jpg" mime_type="image/jpeg" /> </image>
</cover>
<date_published>1997-01-011</date_published>
<open_access />
<section>
<title>Articles</title>
<abbrev>ART</abbrev>
<article>
</article>
<article>
</article>
</section>
</issue>
<issue identification="title" published="true" current="false">
<title>Núm.: 2 </title>
<volume>0</volume>
<number>2</number>
<year>1998</year>
<cover>
<caption> </caption>
<image>
<href src="http://rev.cat/imatges/port.jpg" mime_type="image/jpeg" /> </image>
</cover>
<date_published>1998-01-011</date_published>
<open_access />
<section>
<title>Articles</title>
<abbrev>ART</abbrev>
<article>
</article>
<article>
</article>
</section>
</issue>
.
</issues>
Si algun camp obligatori per a un número no existeix, cal posar les etiquetes de codificació i, com a valor, un espai. Per exemple, el camp caption de la portada del número:
<caption> </caption>
Definició del camps dels articles (<article></article>)¶
Les etiquetes per identificar els articles que s'inclouen a les seccions són <article></article>. Si es vol identificar l'idioma en que està escrit, cal usar l'atribut language i, com a valor, cat per català, spa per castellà, eng per anglès, und si no s'especifica (per a codis addicionals consulteu http://loc.gov/standars/iso639-2/langcode.html). Per exemple:
<article language= cat >
Els camps que pot incloure un article són:
|
Descripció |
|
Codificació |
|
Obligatori? |
|
Repetible? |
|
Format |
|
|
Títol |
|
<title></title> |
|
Sí |
|
Sí* |
|
Text |
|
|
Data de publicació |
|
<date_published> </date_published> |
|
No |
|
No |
|
AAAA-MM-DD |
|
|
Autor |
|
<author></author> |
|
Sí |
|
Sí |
|
Vegeu el quadre Camps autor |
|
|
Pàgines |
|
<pages></pages> |
|
Sí |
|
No |
|
Text. Si hi ha més d una pàgina, separeu-les amb un guió |
|
|
Text complet |
|
<galley></galley> |
|
Sí |
|
Sí |
|
Vegeu el quadre Camps text complet |
|
|
Resum |
|
<abstract></abstract> |
|
No |
|
Sí* |
|
Text |
|
|
Accés al text complet |
|
<open_access /> |
|
No |
|
No |
|
Només cal posar l etiqueta si volem indicar que és accés obert i en la definició del número hem indicat embargament. |
|
|
Indexació |
|
Indexing |
|
No |
|
No |
|
Vegeu el quadre Camps indexació |
|
|
Arxius addicionals |
|
Supplemental_file |
|
No |
|
No |
|
|
|
- Es pot repetir el camp sempre que s'indiqui l'idioma com a atribut. Per exemple:
<title locale="cat">Títol en català de l'article</title>
<title locale="esp">Títol en castellà de l'article</title>
<title locale="eng">Títol en anglès de l'article</title>
o bé:
<title>Títol de l'article</title>
Camps author (<author></author>)¶
Aquesta etiqueta té un atribut obligatori (primary_contact) que ens indica si l'autor és el contacte principal. Els valors que pot prendre són true o false. Si hi ha més d un autor, un d'ells ha de ser el contacte principal. Exemple:
<article>
<author primary_contact="true"> .... </author>
....
</article>
<article>
<author primary_contact="false"> .... </author>
<author primary_contact="true"> .... </author>
<author primary_contact="false"> .... </author>
....
</article>
Els camps que ha de tenir un autor són els següents:
|
Descripció |
|
Codificació |
|
Obligatori? |
|
Repetible? |
|
Format |
|
|
Correu |
|
<email></email> |
|
Sí |
|
No |
|
Text. Si no el coneixeu, deixeu un espai en blanc |
|
Si no coneixeu alguna de les dades obligatòries de l'autor, afegiu les etiquetes i, com a valor, un espai en blanc. Exemple:
<author primary_contact="true">
<first[[[[name]]]]> </first[[[[name]]]]>
<last[[[[name]]]]> </last[[[[name]]]]>
<email> </email>
</author>
Camps text complet (<galley></galley>)¶
Els camps que ha de tenir aquesta etiqueta per incloure un document PDF o un enllaç URL, on es pot trobar el text complet de l'article, són els següents:
|
Descripció |
|
Codificació |
|
Obligatori? |
|
Repetible? |
|
Format |
|
|
Etiqueta |
|
<label></label> |
|
Sí |
|
No |
|
Text complet |
|
|
Arxiu |
|
<file></file> |
|
Sí |
|
No |
|
Href, embed |
|
El document a text complet es pot incloure amb dos formats:
- href: fent un enllaç a la URL, on està disponible el document en format PDF o HTML
<file>
<href src="http://www.raco.cat/art/article.pdf" mime_type="application/pdf" />
</file>
- embed: incrustant el document PDF en l'arxiu XML
<file>
<embed encoding="base64" file[[[[name]]]]="article.pdf" mime-type="application/pdf">
</embed>
</file>
Si l'article no ofereix el text complet, aleshores cal usar l'etiqueta <htmlgalley></htmlgalley>.
Els camps que cal posar-hi són els següents:
|
Descripció |
|
Codificació |
|
Obligatori? |
|
Repetible? |
|
Format |
|
|
Etiqueta |
|
<label></label> |
|
Sí |
|
No |
|
|
|
|
Arxiu |
|
<file></file> |
|
Sí |
|
No |
|
Href, embed |
|
On l'arxiu ha de ser el següent:
sense_text_complet.html
<html>
<head></head>
<body>
Ho sentim, no disposem del contingut d'aquest article.
Lo sentimos, no disponemos del contenido de este artículo.
Sorry, we do not have the content of this article.
</body>
</html>
Aquest arxiu és per indicar que l'article no s'ofereix a text complet.
Per incloure l'arxiu, cal utilitzar qualsevol dels dos mètodes explicats anteriorment: enllaç (href) o incrustació (embed).
Indexació¶
Si els articles disposen d aquesta informació es pot incloure per tal de preservar-la, però actualment RACO no gestiona aquest tipus d informació.
Les etiquetes que defineixen la indexació són <indexing></indexing>. Els camps que pot tenir són els següents:
|
Descripció |
|
Codificació |
|
Obligatori? |
|
Repetible? |
|
Format |
|
|
Disciplina acadèmica i subdisciplines |
|
<discipline> </dicipline> |
|
No |
|
No |
|
Text Les diferents opcions se separen amb comes |
|
|
Classificació per matèria |
|
<subject_class> </subject_class> |
|
No |
|
No |
|
Text Les diferents opcions se separen amb comes |
|
|
Paraules clau |
|
<subject> </subject> |
|
No |
|
No |
|
Text Les diferents opcions se separen amb comes |
|
|
Abast |
|
<coverage> </coverage> |
|
No |
|
No |
|
Vegeu quadre Camps abast |
|
Camps abast¶
Els camps que es poden incloure a l'abast són els següents:
|
Descripció |
|
Codificació |
|
Obligatori? |
|
Repetible? |
|
Format |
|
|
Termes geogràfics o geoespacials |
|
<geografical></geografical> |
|
No |
|
No |
|
Text |
|
|
Termes històrics o cronològics |
|
<cronological></cronological> |
|
No |
|
No |
|
Text |
|
|
Característiques de la mostra |
|
<sample></sample> |
|
No |
|
No |
|
Text |
|
Exemple
<article language="cat">
<title>OMG, i aixó què és?</title>
<date_published>1997-01-011</date_published>
<author primary_contact = "true">
<first[[[[name]]]]>Rafael</first[[[[name]]]]>
<last[[[[name]]]]>Tauler</last[[[[name]]]]>
<email> </email>
</author>
<pages>7-13</pages>
<htmlgalley>
<label></label>
<file>
<embed encoding="base64" file[[[[name]]]]="redirect.html" mime_type="text/html">PGJyPjxicj5IbyBzZW50aW0sIGFxdWVzdCBubyBkaXNwb3NlbSBkZWwgY29udGluZ3V0IGQnYXF1ZXN0IGFydGljbGUuPGJyPkxvIHNlbnRpbW9zLCBubyBkaXNwb25lbW9zIGRlbCBjb250ZW5pZG8gZGUgZXN0ZSBhcnQmaWFjdXRlO2N1bG8uPGJyPlNvcnJ5LCB3ZSBkbyBub3QgaGF2ZSB0aGUgY29udGVudCBvZiB0aGlzIGFydGljbGUuPGJyPjxicj4=</embed>
</file>
</htmlgalley>
<open_access />
</article>
<article language="cat">
<title>La radiació ionitzant en la indústria alimentària</title>
<date_published>2000-01-011</date_published>
<author primary_contact = "true">
<first[[[[name]]]]>Josep</first[[[[name]]]]>
<last[[[[name]]]]>Calderón</last[[[[name]]]]>
<email> </email>
</author>
<pages>8-11</pages> <galley>
<label>Text complet</label>
<file>
<href src="http://sumaris.cbuc.es/bbdd/ISSN11377976%2FA2000N000005V000000/ISSN11377976A2000N000005V000000article0.pdf" mime_type="application/pdf" />
</file>
</galley>
<open_access />
</article>
Si necessiteu consultar el DTD, contacteu amb l'oficina del CBUC.