Projecte

General

Perfil

Accions

Millora #1915

tancat
FJ FJ

Afegir automàticament els camps de metadades del PDF quan no en tinguin

Millora #1915: Afegir automàticament els camps de metadades del PDF quan no en tinguin

Afegit per Ferran Jorba fa més de 13 anys. Actualitzat fa aproximadament 8 anys.

Estat:
Tancada
Prioritat:
Baixa
Assignat a:
Inici:
27-08-2012
Data de venciment:
Paraula clau:
pdf

Descripció

Aquest estiu he tingut ocasió de tenir a les mans algun lector de llibres (ebook). Aleshores és quan me n'he adonat que si els PDFs no tenen els camps d'autor, títol, matèria o paraules clau el resultat és ben pobre.

De fet, al DDD podem verificar si els nostres PDFs tenen aquests camps en els fitxers .info. Els PDFs generats per programa per les guies docents ja el tenen correctament generat, per exemple:

Pel que fa a les revistes del Servei de Publicacions, sembla que només hi són a les portades, ex:

A la resta, m'ha semblat que n'hi ha ben pocs. Ni a les digitalitzacions retrospectives, ni a les altres. Alguns cops, és poc informativa, per exemple aquesta tesi (trobada a l'atzar):

Els registres bibliogràfics ja tenen aquesta informació, i aquesta informació ve a ser equivalent a la dels Namaste, que ja generem automàticament. Existeixen també d'eines per fer modificacions automàticament (http://www.blog.pythonlibrary.org/2010/05/15/manipulating-pdfs-with-python-and-pypdf/).

Aquesta manipulació té conseqüències: modifiquem els PDFs. Això els fa canviar de tamany i de md5. El PDF que tinguem al DDD, per exemple, seria diferent al PDF que hi hagi a Racó, Recercat o Redi.

El resultat, però, serien uns PDFs molt més útils per ser llegits en aquests dispositius que ara mateix estan proliferant tant.

Pros, contres, comentaris?

BP Actualitzat per Beatriu Piera fa més de 13 anys Accions #1

Hola Ferran,

he llegit de casualitat això que comentes i el sistema de metadades que es fa servir en pdf/A (gestionat per Acrobat, no ho he mirat amb altres programaris) es diu xmp. El sistema permet integrar metadades Dublin Core.

Et passo un exemple d'una prova que he fet:


<x:xmpmeta xmlns:x="adobe:ns:meta/" x:xmptk="Adobe XMP Core 4.2.1-c041 52.342996, 2008/05/07-20:48:00 ">
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#&quot;>
<rdf:Description rdf:about=""
xmlns:xmp="http://ns.adobe.com/xap/1.0/">
<xmp:ModifyDate>2011-12-02T11:05:29+01:00</xmp:ModifyDate>
<xmp:CreateDate>2011-12-02T11:05:29+01:00</xmp:CreateDate>
<xmp:MetadataDate>2011-12-02T11:05:29+01:00</xmp:MetadataDate>
</rdf:Description>
<rdf:Description rdf:about=""
xmlns:dc="http://purl.org/dc/elements/1.1/">
<dc:format>application/pdf</dc:format>
<dc:title>
<rdf:Alt>
<rdf:li xml:lang="x-default">Justificació del Ministerio</rdf:li>
</rdf:Alt>
</dc:title>
<dc:creator>
<rdf:Seq>
<rdf:li>Beatriu Piera Moreno</rdf:li>
</rdf:Seq>
</dc:creator>
</rdf:Description>
<rdf:Description rdf:about=""
xmlns:xmpMM="http://ns.adobe.com/xap/1.0/mm/">
<xmpMM:DocumentID>uuid:084993b2-7426-405a-91d7-4046142deac5</xmpMM:DocumentID>
<xmpMM:InstanceID>uuid:ce1d8bb1-14e0-4173-a002-a9a2fbef05b0</xmpMM:InstanceID>
</rdf:Description>
<rdf:Description rdf:about=""
xmlns:illustrator="http://ns.adobe.com/illustrator/1.0/">
<illustrator:StartupProfile>Print</illustrator:StartupProfile>
</rdf:Description>
</rdf:RDF>
</x:xmpmeta>

BP Actualitzat per Beatriu Piera fa més de 13 anys Accions #2

Ah, em descuidava, també te un apartat propi destinat a informació de copyright que es pot editar donant una URL.

No sé si això et serveix d'alguna cosa...

CA Actualitzat per Cristina Azorin fa més de 10 anys Accions #3

  • Categoria s'ha establert a Tecnologia
  • Temàtica prevista ha canviat de Millora de la interfície del DDD a Tasques informàtiques internes

CA Actualitzat per Cristina Azorin fa aproximadament 8 anys Accions #4

  • Estat ha canviat de Cal més informació a Tancada
Accions

També disponible a: PDF Atom