Millora #1915
tancatAfegir automàticament els camps de metadades del PDF quan no en tinguin
Descripció
Aquest estiu he tingut ocasió de tenir a les mans algun lector de llibres (ebook). Aleshores és quan me n'he adonat que si els PDFs no tenen els camps d'autor, títol, matèria o paraules clau el resultat és ben pobre.
De fet, al DDD podem verificar si els nostres PDFs tenen aquests camps en els fitxers .info. Els PDFs generats per programa per les guies docents ja el tenen correctament generat, per exemple:
- http://ddd.uab.cat/pub/procur/2012-13/g103176p973t2501919a2012-13iCAT.info
- http://ddd.uab.cat/pub/procur/2012-13/g42236p1094t4313133a2012-13iCAT.info
- http://ddd.uab.cat/pub/procur/2012-13/g101063p817t2500254a2012-13iCAT.info
Pel que fa a les revistes del Servei de Publicacions, sembla que només hi són a les portades, ex:
- http://ddd.uab.cat/pub/quaderns/quaderns_a2012n19/quaderns_a2012n19p1.info
- http://ddd.uab.cat/pub/quaderns/quaderns_a2012n19/quaderns_a2012n19p9.info
- http://ddd.uab.cat/pub/quaderns/quaderns_a2012n19/quaderns_a2012n19p87.info
A la resta, m'ha semblat que n'hi ha ben pocs. Ni a les digitalitzacions retrospectives, ni a les altres. Alguns cops, és poc informativa, per exemple aquesta tesi (trobada a l'atzar):
- http://ddd.uab.cat/pub/tesis/2010/tdx-0124111-112637/
- http://ddd.uab.cat/pub/tesis/2010/tdx-0124111-112637/yaa1de1.info
Els registres bibliogràfics ja tenen aquesta informació, i aquesta informació ve a ser equivalent a la dels Namaste, que ja generem automàticament. Existeixen també d'eines per fer modificacions automàticament (http://www.blog.pythonlibrary.org/2010/05/15/manipulating-pdfs-with-python-and-pypdf/).
Aquesta manipulació té conseqüències: modifiquem els PDFs. Això els fa canviar de tamany i de md5. El PDF que tinguem al DDD, per exemple, seria diferent al PDF que hi hagi a Racó, Recercat o Redi.
El resultat, però, serien uns PDFs molt més útils per ser llegits en aquests dispositius que ara mateix estan proliferant tant.
Pros, contres, comentaris?
BP Actualitzat per Beatriu Piera fa més de 13 anys
Hola Ferran,
he llegit de casualitat això que comentes i el sistema de metadades que es fa servir en pdf/A (gestionat per Acrobat, no ho he mirat amb altres programaris) es diu xmp. El sistema permet integrar metadades Dublin Core.
Et passo un exemple d'una prova que he fet:
<x:xmpmeta xmlns:x="adobe:ns:meta/" x:xmptk="Adobe XMP Core 4.2.1-c041 52.342996, 2008/05/07-20:48:00 ">
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#">
<rdf:Description rdf:about=""
xmlns:xmp="http://ns.adobe.com/xap/1.0/">
<xmp:ModifyDate>2011-12-02T11:05:29+01:00</xmp:ModifyDate>
<xmp:CreateDate>2011-12-02T11:05:29+01:00</xmp:CreateDate>
<xmp:MetadataDate>2011-12-02T11:05:29+01:00</xmp:MetadataDate>
</rdf:Description>
<rdf:Description rdf:about=""
xmlns:dc="http://purl.org/dc/elements/1.1/">
<dc:format>application/pdf</dc:format>
<dc:title>
<rdf:Alt>
<rdf:li xml:lang="x-default">Justificació del Ministerio</rdf:li>
</rdf:Alt>
</dc:title>
<dc:creator>
<rdf:Seq>
<rdf:li>Beatriu Piera Moreno</rdf:li>
</rdf:Seq>
</dc:creator>
</rdf:Description>
<rdf:Description rdf:about=""
xmlns:xmpMM="http://ns.adobe.com/xap/1.0/mm/">
<xmpMM:DocumentID>uuid:084993b2-7426-405a-91d7-4046142deac5</xmpMM:DocumentID>
<xmpMM:InstanceID>uuid:ce1d8bb1-14e0-4173-a002-a9a2fbef05b0</xmpMM:InstanceID>
</rdf:Description>
<rdf:Description rdf:about=""
xmlns:illustrator="http://ns.adobe.com/illustrator/1.0/">
<illustrator:StartupProfile>Print</illustrator:StartupProfile>
</rdf:Description>
</rdf:RDF>
</x:xmpmeta>
BP Actualitzat per Beatriu Piera fa més de 13 anys
Ah, em descuidava, també te un apartat propi destinat a informació de copyright que es pot editar donant una URL.
No sé si això et serveix d'alguna cosa...
CA Actualitzat per Cristina Azorin fa més de 10 anys
- Categoria s'ha establert a Tecnologia
- Temàtica prevista ha canviat de Millora de la interfície del DDD a Tasques informàtiques internes
CA Actualitzat per Cristina Azorin fa aproximadament 8 anys
- Estat ha canviat de Cal més informació a Tancada