Tasca #901
tancatCarregues de la MDC al DDD (Cartells J. Vinyals)
Descripció
Actualment estan entrats a la Memòria Digital de Catalunya tots els cartells del fons Vinyals i caldria estudiar la possibilitat de carregar-los automàticament al DDD.
Fitxers
CA Actualitzat per Cristina Azorin fa quasi 16 anys
Correu enviat el 12 de gener de 2010. Josep Sau <jsau@ub.edu>
Hola,
Aqui el Josep Sau de la UB.
El tractament dels "registres" de paper moneda no ha sigut
pas "automatic".
Primer, s'han extret els registres del contentdm en xml
dublin core.
Segon, s'ha fet un programillo gawk especific que:
a) desfeia el xml (format fisic)
b) "convertia" les dades dublin core a una primera
aproximacio marc21 (aquesta es la part critica)
c) generava el fitxer iso2709 (format fisic) de carrega
de bibliografics
Tercer, s'ha preparat a Millennium un perfil local de
carrega per a poder carregar aquests bibliografics.
Mes consideracions:
La conversio de dublin core a marc21 es una aproximacio
basant-se en les indicacions de la gent de catalogacio de
la UB per a aquest cas en concret. S'ha d'estudiar cas
per cas per a cada colleccio.
Una de les dades aprofitades ha sigut la url de la imatge
del paper moneda, que estan carregades al sevidor
d'imatges de cobertes. L'enllaç esta fet per un nom
d'imatge amb el numero de la 001 del cbuc.
Li hem passat el nostre programillo gawk al Jordi Pallares
del CBUC i no se si en pensa aprofitar alguna part per
fer-ne alguna cosa mes generica.
Per a qualsevol altre clariment, aqui estem.
Molta sort.
CA Actualitzat per Cristina Azorin fa més de 15 anys
- Prioritat ha canviat de medium a high
CA Actualitzat per Cristina Azorin fa més de 15 anys
- Assignat a ha canviat de Ferran Jorba a Javier Planella
CA Actualitzat per Cristina Azorin fa més de 15 anys
Passem aquesta tasca al Javier per a que pugui extreure el fitxer xml dublin core de la Memòria Digital de Catalunya en quan als cartells Vinyals.
Un cop extret cal que algú d ela UTP amb criteris bibliotecaris estableixi quines metadades cal passar i quines no, o si cal fer canvis de continguts. Amb aquestes decisions presses ho comentarem amb el Ferran per tal de fer la càrrega definitiva al DDD.
CA Actualitzat per Cristina Azorin fa més de 15 anys
- Assignat a ha canviat de Javier Planella a Ferran Jorba
CA Actualitzat per Cristina Azorin fa més de 15 anys
Canvi de plans!!!
Recollim la col·lecció Vinyals de la MDC per OAI:
i només cal tenir en compte que <dc:source>Memòria Digital de Catalunya</dc:source> hauria de ser 856 42 $n (que caldria que aparegués als registres complets) i el <dc:identifier>http://mdc.cbuc.cat/u?/josepvinyal,59</dc:identifier> que hauria de ser 856 42 $u
FJ Actualitzat per Ferran Jorba fa més de 15 anys
He fet una primera càrrega al DDD de proves:
http://ddd-test.uab.cat:2000/collection/jvinyals
Falta:
- Repassar la conversió, feta una mica a l'engròs (de DC a Marc21).
- Decidir com tindrem els fitxers locals dels cartells, relacionats o no amb els del CEDOC.
- Decidir com tindrem els registres, a la mateixa col·lecció o no que la del CEDOC.
FJ Actualitzat per Ferran Jorba fa aproximadament 15 anys
- Tema ha canviat de Carregues de la MDC al DDD a Carregues de la MDC al DDD (Cartells J. Vinyals)
FJ Actualitzat per Ferran Jorba fa aproximadament 15 anys
Cristina,
em sembla que ja he fet totes les correccions de la conversió que em vas indicar per telèfon: títols, matèries, notes, peu d'impremta, etc. Quan puguis en farem una segona repassada.
També he copiat els cartells del Volum-I al Clariion, enllaçat les miniatures, i aleshores he vist alguns problemes nous:
1. El número de fitxer que tenim en el Volum-I no es correspon al número d'indicador a la MDC. Jo em pensava que sí, i en això m'he basat per enllaçar-los. Com ho he de fer, doncs?
2. Com que jo em fiava d'aquesta equivalència, la meva redistribució per anys segons la catalogació del registre està malament i l'hauré de refer quan sàpiga com.
3. Queden uns 460 cartells per catalogar, que tinc al directori http://ddd.uab.cat/pub/cartellsvinyals/pendent/ (http://ddd.uab.cat/pub/cartellsvinyals/pendent/README.html per les miniatures). És a dir, via OAI m'he baixat 1199 registres DC, però tenim 1656 fitxer .jpg amb cartells. La diferència és de 457.NC Actualitzat per Núria Casaldaliga fa aproximadament 15 anys
Ferran i Cristina,
M'he mirat alguns exemples més dels cartells Vinyals i les conclusions són:
1 - Els que al directori http://ddd.uab.cat/pub/cartellsvinyals/pendent/ tenen No. més p1, p2, p3... aquests segur que van tots en un sol registre, ex. cartellvinyals_1595p3.jpg
2 - Els que tenen No. A, B ex. cartellvinyals_994A.jpg a MDC tenen dos registres, són cartells de dues cares amb informació diferent. D'aquests potser val la pena mantenir els dos registres (ho acabem de pensar amb la Cristina)
3 - Sí, hi han cartells per catalogar segur, perquè els que vam deixar pel final eren cartells en altres llengües(russos del no. 1588 a 1596 ex. cartellvinyals_1595p3.jpg )
Podem mirar ajuntant els cartells esmentats en el punt 1 (que tenen una p de pàgina) com queden i quina diferència hi ha amb el total.
Gràcies
FJ Actualitzat per Ferran Jorba fa aproximadament 15 anys
Segons em va comentar la Núria, el número que ha d'identificar el fitxer és el que es veu en el camp Identificador del MDC. Per exemple:
- http://mdc.cbuc.cat/u?/josepvinyal,1279 -> http://mdc.cbuc.cat/cdm4/item_viewer.php?CISOROOT=/josepvinyal&CISOPTR=1279 -> FJV.1594
El problema és que aquest identificador no s'exporta via OAI, en cap dels dos formats que ofereix contentDM:
També malhauradament, des de l'adreça alternativa ''oficial'' que ofereix el contentDM a la pàgina, http://mdc.cbuc.cat/u?/josepvinyal,1279 fa un doble redireccionament a la pàgina real (http://mdc.cbuc.cat/cdm4/item_viewer.php?CISOROOT=/josepvinyal&CISOPTR=1279) via Javascript, cosa que dificulta qualsevol tractament automàtic (els robots no acostumen a saber Javascript).
Exploraré una doble via: demanar al CBUC a veure si poden configurar la MDC perquè exporti aquest camp via OAI, o seguir el patró obvi de redireccionaments per recollir aquest identificador des de la pàgina HTML.
FJ Actualitzat per Ferran Jorba fa aproximadament 15 anys
El CBUC va canviar la configuració de la MDC perquè aquest identificador s'exporti via OAI. Amb això he fet una nova càrrega al DDD de proves i ja lligant els cartells correctament. El número de registres al DDD de proves és el mateix que al MDC (1199). Com sempre, estan a
http://ddd-test.uab.cat:2000/collection/jvinyals
En el procés de conversió i càrrega m'he trobat alguns errors de picat o codificació que caldrà arreglar a la MDC. Els he adjuntat en un fitxer anomenat errors-jvinyals-mdc_a2010m1d25.txt. Alguns d'aquests errors els he arreglat (o apanyat) al DDD de proves per poder tirar endevant, però no al MDC, perquè no hi tinc accés.
Jo diria que caldria arreglar-los al MDC perquè siguin iguals que al DDD. Específicament, entenc que cal arreglar la duplicitat del cartell ''Què vol aquesta gent?'', que està catalogat dos cops al MDC amb el mateix identificador però un any diferent de publicació:
Què cal fer? Al meu entendre, cal repassar-ho amb calma per veure si hi ha registres amb imatges parcials (A sense B o 1 sense 2) i mirar el el directori pendent, on hi ha més duplicats. Hi trobareu tres visions en aquestes adreces:
A part d'això caldrà concretar com gestionem les col·leccions i subcol·leccions de cartells polítics (reals o virtuals).
FJ Actualitzat per Ferran Jorba fa aproximadament 15 anys
- Assignat a ha canviat de Ferran Jorba a Cristina Azorin
FJ Actualitzat per Ferran Jorba fa aproximadament 15 anys
Ja estan carregats al DDD públic. De moment no és ni una col·lecció virtual individual (que es pot crear), sinó que forma part de la de cartells polítics amb els del CEDOC.
Cal fer:
- Modificar el portalbox perquè en faci menció.
- Decidir què fer amb els pendents.
- Arreglar el «Què vol aquesta gent» (http://ddd.uab.cat/search?cc=carpol&p=que+vol+aquesta+gent).
FJ Actualitzat per Ferran Jorba fa aproximadament 15 anys
Hem fet una detecció de duplicats entre les col·leccions CEDOC i Vinyals a partir de les imatges. El resultat està a:
http://ddd.uab.cat/pub/cartells/duplicats/imagedupesreport.html
CA Actualitzat per Cristina Azorin fa aproximadament 15 anys
Eulàlia cal fer:
- refrito de portalbox, un text en català, castellà i anglès
1. Cartells del Fons Josep Vinyals.
Col·lecció de més de 1.100 cartells polítics dels anys 1970 i 1980 de la col·lecció personal de Josep Vinyals. Inclou cartells dels principals partits polítics de l'estat espanyol així com de les comunitats autònomes, principalment Catalunya, i alguns de l'administració local com Barcelona. També hi ha cartells dels moviments sindicals. Destaquen un conjunt de cartells d'àmbit internacional de diferents dècades del segle XX, principalment d'Itàlia i Xile, així com alguns de França, Portugal, Grècia i la Unió Soviètica.
2. Cartells polítics.
Col·lecció de cartells polítics del Centre de Documentació de la Comunicació (CEDOC), adscrit a la Biblioteca de Comunicació i Hemeroteca General. Aquest fons compren, principalment, cartell de la Transició democràtica espanyola i arriba fins la dècada actual. Trobareu exemples on es reflecteix l’activitat política del període abans esmentat, amb un gran nombre d'exemples sobre propaganda electoral, tant de l’àmbit municipal, estatal, autonòmic o europeu, com publicitat dels diferents partits.
- Arreglar els registres dels cartells que tenen més d'una cara (A / B). S'han de fusionar al DDD i a la MDC. Ha de quedar el registre complet, per anar buscant els fitxers que tenen aquestes lletres, cal entrar un per un a cada directori des de l'adreça http://ddd.uab.cat/pub/cartellsjvinyals/
- Es possible que hi hagi alguns que tenen p1 i p2, si els trobes a l'hora de fer el repàs deixa'ls apuntats.
- Arreglar el «Què vol aquesta gent» (http://ddd.uab.cat/search?cc=carpol&p=que+vol+aquesta+gent). Fer bé el registre que té el cartell i esborrar l'altra. Fer-ho també a la MDC.
- Anem a mirar la pàgina per detectar possibles duplicats http://ddd.uab.cat/pub/cartells/duplicats/imagedupesreport.html i en el cas de que ja els tinguin al CEDOC esborrem els registres del Vinyals i afegim en els registres del CEDOC una nota (buscar l'etiqueta) que indiqui 'També disponible en la col·lecció Cartells Fons Josep Vinyals XXX (on XXX és el número que surt al fitxer). No esborrem els registres a la MDC.
- També pot trobar algun duplicat dins el mateix CEDOC, caldrà esborrar el registre del que no tingui marca d'aigua i davant el dubte comentar-li a la Teresa.
- Fer secundàries (altra 856) si els cartells són en dos idiomes. Pots mirar d'exemple: "Es el temps del canvi"
- Arreglar a la MDC la paraula 'univarsitat', amb el llistat en paper. Ja s'han arreglat al DDD.
Pel futur cal decidir què fer amb els pendents!!!! N'hi ha alguns que es van digitalitzar dues vegades (llibertat patriotes catalans, per exemple) i d'altres que són culturals i que es catalogaran més endavant.
ES Actualitzat per Eulàlia Serre fa quasi 15 anys
- Assignat a ha canviat de Cristina Azorin a Eulàlia Serre
ES Actualitzat per Eulàlia Serre fa quasi 15 anys
Han estat revisats els possibles duplicats de cartells dels fons del CEDOC i del fons Vinyals [http://ddd.uab.cat/pub/cartells/duplicats/imagedupesreport.html]. Adjunto el fitxer duplicatsddd.docx on estan llistats els duplicats detectats i algunes incidències.
CA Actualitzat per Cristina Azorin fa quasi 15 anys
- Assignat a ha canviat de Eulàlia Serre a Teresa Santos
TS Actualitzat per Teresa Santos fa més de 14 anys
- Estat ha canviat de Creada a Tancada