Projecte

General

Perfil

Formularis » Historial » Temàtica 4

Ferran Jorba, 05-06-2014 13:22

1 1 Cristina Azorin
h1. Formularis
2
3 2 Ferran Jorba
h2. Paquet d'informació enviat (SIP - DDD local)
4 1 Cristina Azorin
5
Les informacions que arriben per aquest tipus d'ingesta són les metadades descriptives i un o més fitxers, generalment el paquet es correspon a un sol registre del DDD.
6
7
* Es fa control de formats manual. Recomanació de pujar fitxers en formats oberts i majoritàriament en pdf.
8
* Normalització manual dels noms dels fitxers segons la normativa interna.
9
* Les metadades més els fitxers generen un paquet anomenat tar.gz
10
11 2 Ferran Jorba
h2. Paquet d'informació d'arxiu (AIP - Clariion)
12 1 Cristina Azorin
13
Les AIP són unitats d'arxiu, en el cas del DDD seria una unitat per directori; pot haver unes unitats petites, com articles de revista, o números sencers en el cas de les revistes de la UAB, o anys en el cas dels cartells polítics.
14
15
* Es crea el registre bibliogràfic ric (per exemple, s'afegeixen les etiquetes 773).
16
* Es crea l'etiqueta 856 amb l'enllaç.
17
* Es generen les metadades Namaste (1,2,3,4).
18
* Es creen els fitxers .info amb les metadades administratives.
19
* Es genera el fitxer de paritat par2. Fitxer extra amb redundància d'un o més fitxers (típicament un 10%25). Si algun fitxer es corromp es pot recuperar fins al 10%25 de tots els fitxers.
20
* Generació md5 de tots els fitxers de tots els discos
21
22
* El control de versions permet la traçabilitat i recuperació de metadades administratives i fitxers. Només per al clariion. Pot actuar com a còpia de seguretat perquè es fan còpies diàries, una justament dins del mateix clariion, i 5 còpies dins del Volum-I.
23
* Dircloud, interfície de consulta dels AIP del DDD. Actua sobre tots els discos (clariion, volum-i, volum-ia).
24
* Els checksums es fan de  manera esporàdica en cas d'haver de reestructurar un gran volum de fitxers.
25 3 Ferran Jorba
* Còpies de seguretat del clariion. Es fa una còpia al dia i la primera i la segona còpia en discos virtuals. Es fa un clon de tots els discos de la UAB i un cop al mes s'envien fora de la UAB.
26 1 Cristina Azorin
* Com a eines de gestió interna disposem d'un programa de gestió de fitxers, en aquest moment el més utilitzat és webadmin.php.
27
Per a la modificació de metadades disposem de la possibilitat d'editar les metadades descriptives en Marc21.
28
29 2 Ferran Jorba
h2. Paquet d'informació de diseminació (DIP - DDD)
30 1 Cristina Azorin
31 4 Ferran Jorba
El DIP és l'interfície de consulta. En el nostre cas és el DDD, que permet les cerques i l'obtenció de resultats i documents.
32 1 Cristina Azorin
33
* No demanem als usuaris una identificació obligatòria, només fem la distinció si la màquina té IP de la UAB o no per a la consulta dels documents restringits.
34
* La interrogació de les dades es pot fer per les caselles de cerca i els resultats es poden obtenir en html generalment o en diferents formats d'exportació de dades (XML, Marc21...). Per al traspàs de grans paquets d'informació es poden generar automàticament a través del programa Bag-it.
35
* L'OAI és el sistema de diseminació per màquines, generalment recol·lectors (per exemple, Recolecta, Europeana...).
36
* Hi ha robots que recuperen les dades directament de les pàgines web en html, per exemple, Google.