Projecte

General

Perfil

Accions

Format per a la importació de metadadesi dades a RACO

Característiques de l arxiu

L'arxiu per a la importació ha de ser de contingut ASCII codificat amb el joc de caràcters UTF-8.

El nom de l'arxiu XML no pot contenir diacrítics i d'altres caràcters (ñ, ç...).

La llargada total de l arxiu és limitada a 175 articles.

Estructura de l'arxiu

La descripció de cada sumari d una revista correspon a un conjunt d articles tal com es defineix més endavant:

L'arxiu ha de començar amb <issues> i acabar amb </issues>.

Cada sumari ha de començar amb <issue> i acabar amb </issue>, i es pot compondre de diversos articles, agrupats per seccions.

Cal agrupar els articles segons la secció a la qual pertanyen, <section> i </section>. Si la revista no té seccions, cal utilitzar la general, Articles, com es mostra en el següent exemple:


    <section>

          <title>Articles</title>

          <abrev>ART</abrev>

        <article>...</article>

    </section>

Cada article ha de començar amb <article> i acabar amb </article>.

El format de l arxiu serà el següent:


 <isues>

  <issue>

   <section>

    <title>Nom secció1</title>

    <article>...</article> 

    <article>...</article>

    ...

    </section> 

    <section>

     <title>Nom secció2</title>

     <article> </article>

     </section>

     ...

     </issue>

     <issue>

     <section>

     <title>Articles</title>

     <article>

     </article>

     <article>

     </article>

     ...

    </section>

   </issue>

  </issues>

Definició dels camps del número (<issue></issue>)

Les marques d inici i fi de les dades d'un número són <issue> i </issue>. Aquesta marca d'inici ha de tenir els següents tres atributs:

  • identification: indica quin camp del número s utilitza per identificar-lo. El seu valor a RACO ha de ser title .
  • published: mostra si s'ha publicat o no. El seu valor pot ser true o false.
  • current: indica si és el darrer número. El seu valor pot ser true o false.

Per exemple:


  <issue identification="title" published="true" current="false">

Els camps que es poden incloure dins un número són:

Descripció Codificació Obligatori? Repetible? Format
Títol <title></title> No Text
Descripció <description></description> No No Text
Volum <volume></volume> No No Número
Número <number></number> No No Número
Any <year></year> No Número
Portada <cover></cover> No Vegeu el quadre Camps portada
Data de publicació <date_published></date_published> No No Data
Accés al text complet <access_date></access_date> o bé, <open_acces /> No Vegeu el quadre Camps accés text complet
Secció <section></section> Si Vegeu el quadre Camps secció

Camps portada (<cover></cover>)

Els camps que ha de tenir la portada són els següents:

Descripció Codificació Obligatori? Repetible? Format
Etiqueta <caption></caption> No Espai en blanc
Imatge <image></image> No href o embeded

La imatge es pot incloure amb dos formats:

  • href: fent un enllaç a la URL on està disponible la imatge.

 <image>

  <href src="http://www.raco.cat/imatges/portada.jpg" mime_type="image/jpeg" />    

 </image>

  • embeded: incrustant la imatge en l'arxiu xml.

 <image>

  <embed file[[[[name]]]]="portada.jpg" encoding="base64" mime_type="image/jpeg"></embed>

 </image>

Camps accés text complet

Cal indicar el tipus d accés que ofereix la revista al text complet dels articles inclosos en aquest número:

  • Accés obert. Cal usar l etiqueta <open_access/>
  • Text embargat segons les Condicions d'accés obert de la revista. És necessari utilitzar l etiqueta <access_date> i indicar la data (en format AAAA-MM-DD) a partir de la qual serà accessible el text complet. Exemple:

 <access_date>2007-11-01</access_date>

Camps secció (<section></section>)

Els camps que ha de contenir una secció són els següents:

Descripció Codificació Obligatori? Repetible? Format
Títol <title></title> No Títol de la secció ja existent a la revista
Abreviatura <abrev></abrev> No No Abreujament de la secció
Articles <article></article> Vegeu quadre Camps article

Exemple:


 <section>

    <title>Articles</title>

    <abrev>ART</abrev>

    <article>

         ...

    </article>

    <article>

       ...

    </article>

 </section>

Si voleu definir seccions per a la revista, poseu-vos en contacte amb l oficina del CBUC.

Exemple número:


 <issues>

 <issue identification="title" published="true" current="false">

    <title>Núm.: 1 </title>

    <volume>0</volume>

    <number>1</number>

    <year>1997</year>

    <cover>

         <caption> </caption>

         <image>

            <href src="http:/cbuc.es/img/portada.jpg" mime_type="image/jpeg" />          </image>    

    </cover>

    <date_published>1997-01-011</date_published>    

    <open_access />

    <section>

         <title>Articles</title>

         <abbrev>ART</abbrev>

         <article>

                        </article>

                        <article>

                     </article>

    </section>

 </issue>

 <issue identification="title" published="true" current="false">

    <title>Núm.: 2 </title>

    <volume>0</volume>

    <number>2</number>

    <year>1998</year>

    <cover>

        <caption> </caption>

        <image>

           <href src="http://rev.cat/imatges/port.jpg" mime_type="image/jpeg" />         </image>    

    </cover>

    <date_published>1998-01-011</date_published>    

    <open_access />

    <section>

       <title>Articles</title>

       <abbrev>ART</abbrev>

       <article>

       </article>

       <article>

       </article>

    </section>

 </issue>

 .

 </issues>

Si algun camp obligatori per a un número no existeix, cal posar les etiquetes de codificació i, com a valor, un espai. Per exemple, el camp caption de la portada del número:


<caption> </caption>

Definició del camps dels articles (<article></article>)

Les etiquetes per identificar els articles que s'inclouen a les seccions són <article></article>. Si es vol identificar l'idioma en que està escrit, cal usar l'atribut language i, com a valor, cat per català, spa per castellà, eng per anglès, und si no s'especifica (per a codis addicionals consulteu http://loc.gov/standars/iso639-2/langcode.html). Per exemple:


 <article language= cat >

Els camps que pot incloure un article són:

Descripció Codificació Obligatori? Repetible? Format
Títol <title></title> Sí* Text
Data de publicació <date_published> </date_published> No No AAAA-MM-DD
Autor <author></author> Vegeu el quadre Camps autor
Pàgines <pages></pages> No Text. Si hi ha més d una pàgina, separeu-les amb un guió
Text complet <galley></galley> Vegeu el quadre Camps text complet
Resum <abstract></abstract> No Sí* Text
Accés al text complet <open_access /> No No Només cal posar l etiqueta si volem indicar que és accés obert i en la definició del número hem indicat embargament.
Indexació Indexing No No Vegeu el quadre Camps indexació
Arxius addicionals Supplemental_file No No
  • Es pot repetir el camp sempre que s'indiqui l'idioma com a atribut. Per exemple:

 <title locale="cat">Títol en català de l'article</title>

 <title locale="esp">Títol en castellà de l'article</title>

 <title locale="eng">Títol en anglès de l'article</title>

o bé:


 <title>Títol de l'article</title>

Camps author (<author></author>)

Aquesta etiqueta té un atribut obligatori (primary_contact) que ens indica si l'autor és el contacte principal. Els valors que pot prendre són true o false. Si hi ha més d un autor, un d'ells ha de ser el contacte principal. Exemple:


 <article>

 <author primary_contact="true"> .... </author>

 ....

 </article>

 <article>

 <author primary_contact="false"> .... </author>

 <author primary_contact="true"> .... </author>

 <author primary_contact="false"> .... </author>

 ....

 </article>

Els camps que ha de tenir un autor són els següents:

Descripció Codificació Obligatori? Repetible? Format
Nom <first[[name]]></first[[name]]> No Text
Cognoms <last[[name]]></last[[name]]> No Text
Correu <email></email> No Text. Si no el coneixeu, deixeu un espai en blanc

Si no coneixeu alguna de les dades obligatòries de l'autor, afegiu les etiquetes i, com a valor, un espai en blanc. Exemple:


 <author primary_contact="true">

    <first[[[[name]]]]> </first[[[[name]]]]>

    <last[[[[name]]]]> </last[[[[name]]]]>

    <email> </email>

 </author>

Camps text complet (<galley></galley>)

Els camps que ha de tenir aquesta etiqueta per incloure un document PDF o un enllaç URL, on es pot trobar el text complet de l'article, són els següents:

Descripció Codificació Obligatori? Repetible? Format
Etiqueta <label></label> No Text complet
Arxiu <file></file> No Href, embed

El document a text complet es pot incloure amb dos formats:

  • href: fent un enllaç a la URL, on està disponible el document en format PDF o HTML

 <file>

           <href src="http://www.raco.cat/art/article.pdf" mime_type="application/pdf" />

 </file>

  • embed: incrustant el document PDF en l'arxiu XML

 <file>

          <embed encoding="base64" file[[[[name]]]]="article.pdf" mime-type="application/pdf">

  </embed>

 </file>

Si l'article no ofereix el text complet, aleshores cal usar l'etiqueta <htmlgalley></htmlgalley>.

Els camps que cal posar-hi són els següents:

Descripció Codificació Obligatori? Repetible? Format
Etiqueta <label></label> No
Arxiu <file></file> No Href, embed

On l'arxiu ha de ser el següent:

sense_text_complet.html


 <html>

 <head></head>

 <body>

 Ho sentim, no disposem del contingut d'aquest article.

 Lo sentimos, no disponemos del contenido de este artículo.

 Sorry, we do not have the content of this article.

 </body>

 </html>

Aquest arxiu és per indicar que l'article no s'ofereix a text complet.

Per incloure l'arxiu, cal utilitzar qualsevol dels dos mètodes explicats anteriorment: enllaç (href) o incrustació (embed).

Indexació

Si els articles disposen d aquesta informació es pot incloure per tal de preservar-la, però actualment RACO no gestiona aquest tipus d informació.

Les etiquetes que defineixen la indexació són <indexing></indexing>. Els camps que pot tenir són els següents:

Descripció Codificació Obligatori? Repetible? Format
Disciplina acadèmica i subdisciplines <discipline> </dicipline> No No Text Les diferents opcions se separen amb comes
Classificació per matèria <subject_class> </subject_class> No No Text Les diferents opcions se separen amb comes
Paraules clau <subject> </subject> No No Text Les diferents opcions se separen amb comes
Abast <coverage> </coverage> No No Vegeu quadre Camps abast

Camps abast

Els camps que es poden incloure a l'abast són els següents:

Descripció Codificació Obligatori? Repetible? Format
Termes geogràfics o geoespacials <geografical></geografical> No No Text
Termes històrics o cronològics <cronological></cronological> No No Text
Característiques de la mostra <sample></sample> No No Text

Exemple


 <article language="cat">

    <title>OMG, i aixó què és?</title>

    <date_published>1997-01-011</date_published>

    <author primary_contact = "true">

    <first[[[[name]]]]>Rafael</first[[[[name]]]]>

    <last[[[[name]]]]>Tauler</last[[[[name]]]]>

    <email> </email>

    </author>

    <pages>7-13</pages>                    

    <htmlgalley>

    <label></label>

    <file>

    <embed encoding="base64" file[[[[name]]]]="redirect.html" mime_type="text/html">PGJyPjxicj5IbyBzZW50aW0sIGFxdWVzdCBubyBkaXNwb3NlbSBkZWwgY29udGluZ3V0IGQnYXF1ZXN0IGFydGljbGUuPGJyPkxvIHNlbnRpbW9zLCBubyBkaXNwb25lbW9zIGRlbCBjb250ZW5pZG8gZGUgZXN0ZSBhcnQmaWFjdXRlO2N1bG8uPGJyPlNvcnJ5LCB3ZSBkbyBub3QgaGF2ZSB0aGUgY29udGVudCBvZiB0aGlzIGFydGljbGUuPGJyPjxicj4=</embed>

    </file>

    </htmlgalley>

    <open_access />            

 </article>

 <article language="cat">

    <title>La radiació ionitzant en la indústria alimentària</title>

    <date_published>2000-01-011</date_published>

    <author primary_contact = "true">

    <first[[[[name]]]]>Josep</first[[[[name]]]]>

    <last[[[[name]]]]>Calderón</last[[[[name]]]]>

    <email> </email>

    </author>

    <pages>8-11</pages>                            <galley>

    <label>Text complet</label>

    <file>                        

    <href src="http://sumaris.cbuc.es/bbdd/ISSN11377976%2FA2000N000005V000000/ISSN11377976A2000N000005V000000article0.pdf" mime_type="application/pdf" />    

    </file>

    </galley>

    <open_access />                    

 </article>

Si necessiteu consultar el DTD, contacteu amb l'oficina del CBUC.

Actualitzat per fa quasi 17 anys · 0 revisions