Tasca #536
tancatBibliogràfics: conversió dels registres a partir de les regles del CCUC
Descripció
Ferran, he reorganitzat els missatges. A veure si ara ens hi entenem millor. M'ha quedat una mica llarg però he volgut mantenir l'historial de cada cas.
Les principals diferències entre CCUC-Traces són:
CAMP 700 En el CCUC feien servir el $y (CATMARC) per designació de funcions. Nosaltres, no tenim $y i la designació de funcions la fem en un $l (entre parèntesis). El CBUC han convertit $y en ‘,$e’. Podem passar de $l a ‘($e)’ (exceptuant els que tinguin la ocurrència ‘$l Pseudònim’ (que serà ($cPseudònim))??3 de juliol: FET.
El cas dels Pseudònims els gestionarem més endavant
Vigila perquè em dius: "em sembla que la regla del 700$l ja està contemplada en les conversions del CBUC, '''si canvio el $c per $e:
'''
700$l | <A28$e(nso) | '(' + S + ')'"
El $c correspon a dates i es converteix en $d. Estem parlant de passar el $l a $e, oi?
CAMP 600Traces utilitza el $j, subcamp que té la mateixa casuística –designació de funcions- que el $l del camp 700 de Traces o que el $y del camp 700 del CBUC (en MARC21, ($e)). S’hauria de passar a ($e), però s’ha de tenir en compte que el CBUC no té aquest subcamp en el 600, i per tant, és de preveure que no consti en els paràmetres de la conversió.
3 de juliol: FET perquè dius
El 600$l efectivament no hi era, i hi he afegit aquesta regla:
600$j | <A43$e(nso) | '(' + S + ')'
CAMP 080 (## $a)El CCUC hi té el topogràfic. Nosaltres també, però, a més, hi posem:
- $a Biblioteca
- $g Entitat gestora (normalment, UAB)
- $d topogràfic
Tu dius:
080: Hi afegeixo els subcamps $d i $g a les regles perquè de moment passin tal qual, tot i que jo diria que l'hauríeu de considerar i col·locar-lo en un altre lloc. Diria que hauria d'anar en algun camp de holdings (http://www.loc.gov/marc/holdings/), potser el 852, no sé.
080$d | 080(nt)$d(nso) | S
080$g | 080(nt)$g(nso) | S
3 de juliol. La 080 es visualitza en una 993(Pendent de canvi de camp)
CAMP 659. Cronologia pautadaIndicador ##, subcamp $a
Hi ha la possibilitat de passar-la a una 650??. A la conversió del 19 de juny s'ha convertit en una 653.
3 de juliol. Mantenim la 659, tal com tu dius a
Cristina, l'etiqueta 659 va, efectivament, a la 653 segons les regles del CBUC:
//Etiq 659 (R)
659I1 | 653I1 | ' '
659I2 | 653I2 | ' '
659$? | 653 | + If(ns>1) Then ';'
659$? | 653(nt)$a(nso) | S
De debò estàs segura que la vols a la 650? Després ja no la podràs destriar fàcilment. I si la mantenim com a 659? Sí, d'acord.
La 008 i la Capçalerano crec que hi hagi problema en la conversió. Queda pendent la pos. 07 de la capçalera, en què hi tenim el valor ‘b’
3 de juliol. La Joana proposa inventar-se una etiqueta amb valor '9' amb la indicació "article" per als registres que a la pos. 07 de la Capçalera tinguin el valor 'b'; també caldria fer el mateix per a "monografia" (valor 'm'); "part de monografia" (valor 'a') i "fitxa de revista" (valor 's').
CAMP 257(Indicador ## subcamp $a)
Contingut de l'etiqueta: "Document electrònic"
3 de juliol. La Joana diu d'esborrar-lo.
CAMP 440Tot i que el CCUC conserva l'etiqueta, hauria de ser una 490
3 de juliol: La Joana diu que el CCUC adoptarà la 490 (col·lecció tal i com apareix al document) i la 830 (nom de l'encapçalament acceptat, encara que no coincideixi amb el que apareix al document). A Traces hauríem de passar a la 490. Després miraríem d'incorporar la 830.
CAMP 590. Nota seccióIndicador ## $a
És on consta el nom de la secció d’un recurs continu. El CCUC la fa servir amb la descripció “Local CCUC ISBD”. És a dir, el CCUC usa l’etiqueta per a una altra cosa.
3 de juliol. Es visualitza i la mantenim
CAMP 591. Nota obra citadaIndicador ## $a
'''A la conversió es conserva l'etiqueta i es visualitza'''
3 de juliol. FET
CAMP 592. Nota obra de teatreIndicador ## $a
3 de juliol. No es visualitza
CAMP 740. Referència obra mare de les fitxes analítiquesIndicadors 0? subcamps $a, $w
A la conversió passa a una 730 tot i que aquesta etiqueta no és a les taules de conversió del CCUC.
Jo proposo de convertir el $w (convertida ara en la conversió en $x) en '.#’ i, així, l’etiqueta només tindria el subcamp ‘$a’, l’única que m’ha semblat que consta a la Library of Congress.
3 de juliol. Mantenim l'etiqueta i convertim $w (o $x) en '.#'??
CAMP 886 (Indicador ## subcamp $a) (fons buidat)És una etiqueta que no consta a les taules de conversió del CCUC i no sé quina equivalència li podem donar perquè m'és difícil buscar-li la correspondència al catàleg. Li pregunto a la Joana
3 de juliol. No es visualitza
Se'm pot escapar alguna cosa però jo diria que hem ajustat bastant.
Fitxers
FJ Actualitzat per Ferran Jorba fa quasi 17 anys
- Assignat a ha canviat de nobody a Ferran Jorba
FJ Actualitzat per Ferran Jorba fa quasi 17 anys
Cristina,
em sembla que la regla del 700$l ja està contemplada en les conversions del CBUC, si canvio el $c per $e:
700$l | <A28(nt)$e(nso) | '(' + S + ')'
El tema de «Pseudònim» crec que és preferible gestionar-ho després.
El 600$l efectivament no hi era, i hi he afegit aquesta regla:
600$j | <A43(nt)$e(nso) | '(' + S + ')'
080: Hi afegeixo els subcamps $d i $g a les regles perquè de moment passin tal qual, tot i que jo diria que l'hauríeu de considerar i col·locar-lo en un altre lloc. Diria que hauria d'anar en algun camp de holdings (http://www.loc.gov/marc/holdings/), potser el 852, no sé.
080$d | 080(nt)$d(nso) | S 080$g | 080(nt)$g(nso) | S
CR Actualitzat per Cristina Riera fa quasi 17 anys
Ferran, afegeixo quatre indicacions més a les diferències CCUC-Traces
FJ Actualitzat per Ferran Jorba fa quasi 17 anys
Cristina, l'etiqueta 659 va, efectivament, a la 653 segons les regles del CBUC:
//Etiq 659 (R) 659I1 | 653I1 | ' ' 659I2 | 653I2 | ' ' 659$? | 653 | + If(ns>1) Then ';' 659$? | 653(nt)$a(nso) | S
De debò estàs segura que la vols a la 650? Després ja no la podràs destriar fàcilment. I si la mantenim com a 659?
CR Actualitzat per Cristina Riera fa quasi 17 anys
Ferran, d'acord, si es pot mantenir la 659 com a tal, mantenim-la. Per cert, ja he pogut obrir i guardar el document tots els 100-700-600, de la tasca 4. Hauríem de pensar d'exportar-lo en la seva darrera versió, abans de tancar definitivament Vtls.
CR Actualitzat per Cristina Riera fa més de 16 anys
La Joana ha respost a les qüestions pendents, i proposa:
- La pos. 07 de la Capçalera: el valor 'b' (article de recurs continu) no està contemplat. Proposa inventar-se una etiqueta amb valor '9' amb la indicació "article"; també caldria fer el mateix per a "monografia" (valor 'm'); "part de monografia" (valor 'a') i "fitxa de revista" (valor 's').
- Camp 257. Esborrar-lo
- Camp 440. El CCUC adoptarà la 490 (col·lecció tal i com apareix al document) i la 830 (nom de la col·lecció acceptat, encara que no coincideixi amb el que apareix al document)
- Camp 740 (referència obra mare en les parts analítiques). Tot i que segueixen una casuística diferent, la podríem mantenir amb només $a
CR Actualitzat per Cristina Riera fa més de 16 anys
Ostres, ja veig que encara no controlo prou el tema negretes... perdona
FJ Actualitzat per Ferran Jorba fa més de 16 anys
Avui la Cristina i jo hem fet un repàs i en principi ja tenim totes les regles actualitzades. A més, he fet una càrrega amb dades del 15 de juliol 2009 (tasca # .
El que m'he fitxat ara és que hem de tenir en compte tots els errors que dóna el conversor, que fins ara no els hi havia fet cas.
M'ho apunto per donar-vos els missatges.
FJ Actualitzat per Ferran Jorba fa més de 16 anys
Cristina, he adjuntat el fitxer errors-conversio-20090724.log amb els errors de conversió, que fins avui no havia tingut en compte. Diria que majoritàriament són etiquetes que ens hem oblidat de tenir-les en compte.
T'ho podries mirar, si us plau?
CR Actualitzat per Cristina Riera fa més de 16 anys
Ferran,
M'he mirat els errors de conversió. He estat més temps del que em pensava perquè el número de registre d'Invenio no correspon amb el de Vtls. Jo diria que, en la conversió, s'han perdut vora 6 registres.
Les etiquetes que caldria transferir són la 990 i 991.
La 773 repetides les ha transferides totes, i a l'espera de poder-les corregir més endavant, et demano que les conservis tal i com estan.
Pel que fa a la 001, a diferència de la 035, conté un $a. La 001 és present fins al registre 34316 (del registre 34317 al 65423, l'etiqueta 001 no hi és) i indica el número que el registre tenia en el programa ISIS. Jo crec que, a hores d'ara, no té cap utilitat.
Els errors que detecta a la 245 són errors nostres: me'ls apunto.
Ferran, no sé si t'és molta feina, però m'aniria molt bé tenir llistades totes les 110-610-710, totes les 111-611-711, totes les 773 i les 730, tal i com ja ens vas fer amb les 100-600-700? Si t'és molt d'enrenou, deixa-ho. Gràcies.
FJ Actualitzat per Ferran Jorba fa més de 16 anys
Cristina,
acabo de fer una nova conversió dels registres donant per bones les 990 i 991, i passant-les tal qual. T'adjunto el fitxer errors-conversio-20090727.log amb els pocs missatges que ha donat ara. També he carregat a la base de dades aquest fitxer a la base de dades.
FJ Actualitzat per Ferran Jorba fa més de 16 anys
Cristina,
t'he adjuntat els fitxers amb les etiquetes X10 i X11 (en Catmarc). De 730 no n'he trobat cap (en Catmarc). De 773 n'hi ha pràcticament una per registre (52.757), ocupa 4,4 MB i m'ha semblat excessiu com a tasca de conversió. Entenc que és un més un tema de repàs catalogràfic que no un problema de conversió.
CR Actualitzat per Cristina Riera fa més de 16 anys
Gràcies Ferran,
Ja m'he guardat els fitxers. Perdona, la 730 que et demanava és una etiqueta de Marc21. En Catmarc és la 740.
FJ Actualitzat per Ferran Jorba fa més de 16 anys
Cristina,
t'he adjuntat doncs el fitxer amb les 740. Parlaré amb el CBUC a veure com podem detectar i/o extreure els registres massa llargs.
FJ Actualitzat per Ferran Jorba fa més de 16 anys
- Tema ha canviat de CCUC-Traces. Diferències a Conversió dels registres bibliogràfics a partir de les regles del CCUC
FJ Actualitzat per Ferran Jorba fa més de 16 anys
Ara mateix estem avaluant com gestionar els camps d'«obra citada», que en Catmarc estaven com a nota (591 i 592 pel teatre) i que potser haurien d'anar a 600 ($a, $t, $f i fins i tot potser $s o $g):
CR Actualitzat per Cristina Riera fa més de 16 anys
Canvis globals a l'etiqueta 591.
Ferran, m'he estat mirant l'etiqueta 591 i crec que podríem avaluar què suposa el canvi de l'etiqueta a una 600 si féssim aquests canvis globals. He cregut que el més lògic seria partir de la sintaxi més habitual, a veure què. Segueixo, per tant, una expressió tipus:
591 $a Toni Cabré. Viatge a Califòrnia. Barcelona : Edicions 62, 1998
La conversió a la 600:
$a Nom (primer nom i després cognom o cognoms) $t Títol $g Lloc : Editorial, any (col·lecció)
Entre el $a i el $t hi ha sempre un punt, normalment el primer que apareix a l'etiqueta.
Entre el $t i el $g és de preveure que hi hagi el segon punt que apareix a l'etiqueta, tot i que aquí la cosa ballarà més perquè, després d'aquest segon punt, pot haver-hi tres informacions: el lloc d'edició, la part d'un títol que conté un punt, i totes les mencions de responsabilitat.
Jo provaria de fer aquests canvis i deixaria per a més endavant la possibilitat d'introduir $f (any) i $s (versió). Ara veig difícil de destriar-les per poder-les manipular per canvis globals. La llengua de l'obra ($l) no l'hem posat mai a l'etiqueta però es podria pensar d'incloure-la a partir d'ara.
Ja em diràs com ho veus.
FJ Actualitzat per Ferran Jorba fa més de 16 anys
Cristina,
he fet una (segona) conversió que pots valorar, de 1000 en 1000, a:
http://traces-test.uab.cat:2000/search?ln=ca&ot=600&rg=1000&of=hm
Aquesta conversió només consisteix en:
1. El primer punt, $a (autor)
2. El segon, $t (títol)
3. El tercer, $g (misc)
4. La resta, $s (versió).
Tot i així, no és tan trivial com sembla. P. ex., aquesta conversió té en compte que de vegades hi ha inicials i separa correctament casos com aquest (http://traces-test.uab.cat:2000/record/62086/export/hm).:
$a Josep M. Castellet $g Barcelona : Edicions 62, 1988 $t Els escenaris de la memòria
Pel que fa a la normalització de l'autor a forma inversa (Cognom, nom), la veig complicada. Seria més partidari d'analitzar totes les 600 i fer combinatòries de totes les paraules i recollir la forma correcta d'una 600 sense $t (ex., «Castellet, Josep M.») i col·locar-la en lloc de la que té el $t («Josep M. Castellet»).
Encara no m'hem mirat aïllar l'any.
Tampoc no he fet res per millorar el formateig en HTML.
CR Actualitzat per Cristina Riera fa més de 16 anys
Ferran,
He fet una primera ullada a la teva conversió i em sembla que els resultats són força bons. Només hi ha un subcamp (el $sVersió) que, pel que he vist, dóna més errors que encerts (si el cerques veuràs com gairebé sempre hauria de ser $g). Jo el trauria.
Pel que comentes de la 600, ja m'explicaràs com funciona això de fer combinatòries.
També hi ha una cosa de la conversió que no entenc: hi ha etiquetes 600 que estan soles, que han estat extretes de registres que no tenen cap 591. Per què les ensenya?
Estic amb els formularis. Quan pugui em miro la 592.
FJ Actualitzat per Ferran Jorba fa més de 16 anys
Cristina,
te n'estic fent una altra càrrega només amb $a, $t i $g, a veure si ho veus millor.
Pel que fa a la combinatòria, volia dir això: entenc (m'has de dir si és cert) que si hi ha una entrada de l'estil:
600 $a Josep M. Castellet $g Barcelona : Edicions 62, 1988 $t Els escenaris de la memòria
i una altra
600 $a Castellet, Josep M.
el Sr. Castellet només ha de sortir un cop, cert? I millor que surti «al costat» de l'obra que es comenta, no? Aleshores, el que estic pensant és que, per a cada 600$a del registre, fer un conjunt de les paraules que el formen, eliminant punts, guions, etc. En aquest cas, seria el conjunt format per
('Castellet', 'Josep', 'M')
D'etiquetes amb aquest conjunt de paraules, n'hi ha dos: una que té un $t (però no està normalitzat), i l'altra que no té $t, però sí que està normalitzat. Aleshores, dóno per bona la forma del que no té $t, i elimino l'etiqueta 600 que no té el $t, i passo aquest valor al $a de la 600 que sí té $t, reemplaçant el valor antic.
Com ho veus?
PS D'altra banda, en el llistat que t'he mostrat en l'enllaç anterior, si t'hi fixes, mostra ''totes'' les 600, però això ja ens va bé, justament per veure el que t'acabo d'explicar.
CR Actualitzat per Cristina Riera fa més de 16 anys
Ferran,
Ja em miraré la nova càrrega, sense el $s, quan estigui llesta. Quant a les 600 que comentes, si fem el que dius, crec que perdrem molta informació. No sempre que hi ha l'etiqueta 600 amb "Castellet, Josep M." vol dir que només parlin d'una obra d'ell citada en una 591, que també però no només. La 591 són obres que se citen o estudien però no sempre són l'objecte principal de text que s'ha fitxat. Això que proposes podria funcionar per les ressenyes (que representen una quarta part del volum de la base de dades) però no per a la resta. Encara que quedi duplicat, penso que mantenir les 600 tal com estan manté l'estructura (i la lectura) del registre. No sé, si vols en parlem amb més calma.
FJ Actualitzat per Ferran Jorba fa més de 16 anys
Cristina,
no entenc quina informació es perd. L'enllaç [Castellet, Josep M.] davant de l'enllaç [Els escenaris de la memòria] el tindries igualment. Si a més l'article parla d'una altra persona sense citar cap obra en concret, aquesta altra persona també tindria l'enllaç. L'únic que em sembla que el Sr. Castellet hi surti dos cops crea més confusió que altra cosa, i proposo eliminar la 600 on el Sr Castellet està sol.
Un registre com http://traces-test.uab.cat:2000/record/64699, des que hi fem enllaços a l'obra, és massa llarg i costa de trobar-hi res. Val la pena, que els autors hi surtin per duplicat? (D'altra banda, he d'eliminar que els $g siguin enllaços, però ho deixo per més endavant, amb tota la presentació, quan tinguem clar què hi posem.)
CR Actualitzat per Cristina Riera fa més de 16 anys
Ferran,
Em refereixo a registres, els més usuals, d'altra banda, com: http://traces-test.uab.cat:2000/record/25601. 'La poesia catalana del segle XX' (591) és una dada més de l'entrevista, ni més ni menys important que la resta. El que és important és Castellet com a subjecte estudiat en totes les seves disciplines (professionals, vitals, el que vulguis), i no només com a autor de la poesia catalana del segle XX. Als catàlegs aquesta distinció és clara. Si només es veu Castellet associat al títol de 'La poesia catalana del segle XX' com dónes a entendre tot això? L'usuari el més probable és que entengui que parlen del llibre (o no?). Si vol saber Castellet-matèria només el buscarà sol, sense cap $t, i trobarà aquells registres en què Castellet no té cap 591. I això és enganyar-lo. La migració dels registres amb 591 no ha d'excloure que els subjectes continuïn essent matèria, per ells sols. Vaja, jo ho entenc així. Ara, estem d'acord que la informació no es perd, però sí que li dónes un altre sentit i això també ha de tenir la mateixa importància.
El registre llarg que m'enllaces, és veritat, és difícil d'empassar. N'hi ha relativament pocs, d'aquesta mena, i penso que costa de trobar-hi res perquè és llarg (amb això no hi podem fer res, seguirà sent llarg d'una manera com d'un altra) i sobretot perquè no es visualitza bé. Si cada 591 anés llistada, una sota l'altra, seria una altra cosa, no?
FJ Actualitzat per Ferran Jorba fa més de 16 anys
Cristina,
he fet una primera versió, encara imperfecte, de la visualització de les obres citades en forma llista, perquè pugueu valorar el resultat. També he deixat una reindexació de tota la base de dades considerant l'índex obracitada a la 600$t, per provar com funciona la navegació.
FJ Actualitzat per Ferran Jorba fa més de 16 anys
Queda pendent estudiar el tractament de la 592.
FJ Actualitzat per Ferran Jorba fa més de 16 anys
Acabo de fer una nova càrrega amb la 592 passada també a 600$a, $t i $g, tal com vam quedar.
FJ Actualitzat per Ferran Jorba fa més de 16 anys
Em toca mirar si puc normalitzar la 773 en el moment de la càrrega, igual que faig amb les 591 i 592.
FJ Actualitzat per Ferran Jorba fa més de 16 anys
- Tema ha canviat de Conversió dels registres bibliogràfics a partir de les regles del CCUC a Bibliogràfics: conversió dels registres a partir de les regles del CCUC
FJ Actualitzat per Ferran Jorba fa més de 16 anys
Ferran, canvia el $9 de la 035 que digui «TracesVTLSBib».
CR Actualitzat per Cristina Riera fa més de 16 anys
Ferran, he estat donant una ullada a la conversió i em sembla que podem enllestir-la. Hi ha una cosa que potser s'hauria de tenir en compte.
- Veig que fem servir l'etiqueta 980 per a indicar la col·lecció però també la fem servir per a notes locals internes. Ex: http://traces-test.uab.cat:2000/record/19742/export/hm
(Per cert: en aquest registre, per què no es visualitza tota l'etiqueta 520 en format html?)
- També passa una cosa semblant amb l'etiqueta 993, que indica el topogràfic, però també hi ha notes locals internes. Ex: http://traces-test.uab.cat:2000/record/32538/export/hm
Pot haver-hi cap conflicte?
CR Actualitzat per Cristina Riera fa més de 16 anys
- Assignat a ha canviat de Ferran Jorba a Cristina Riera
CR Actualitzat per Cristina Riera fa més de 16 anys
Queda pendent de canviar, un cop s'acabi la conversió, l'ocurrència "$e Pseudònim" per "$c (Pseudònim).
CR Actualitzat per Cristina Riera fa més de 16 anys
- Assignat a ha canviat de Cristina Riera a Ferran Jorba
FJ Actualitzat per Ferran Jorba fa més de 16 anys
- Estat ha canviat de Creada a Tancada
FJ Actualitzat per Ferran Jorba fa més de 16 anys
A veure si separem temes ''menors'' per tancar aquesta ''gran'' tasca:
- # conflicte entre 980.
- # etiqueta 520 es veu incompleta
- # pseudònims
- # canviar el $9 de la 035
- # normalitzar l'etiqueta 773
I tanquem, eh?