Projecte

General

Perfil

Formularis » Historial » Temàtica 2

Ferran Jorba, 05-06-2014 13:15

1 1 Cristina Azorin
h1. Formularis
2
3 2 Ferran Jorba
h2. Paquet d'informació enviat (SIP - DDD local)
4 1 Cristina Azorin
5
Les informacions que arriben per aquest tipus d'ingesta són les metadades descriptives i un o més fitxers, generalment el paquet es correspon a un sol registre del DDD.
6
7
* Es fa control de formats manual. Recomanació de pujar fitxers en formats oberts i majoritàriament en pdf.
8
* Normalització manual dels noms dels fitxers segons la normativa interna.
9
* Les metadades més els fitxers generen un paquet anomenat tar.gz
10
11
12 2 Ferran Jorba
h2. Paquet d'informació d'arxiu (AIP - Clariion)
13 1 Cristina Azorin
14
Les AIP són unitats d'arxiu, en el cas del DDD seria una unitat per directori; pot haver unes unitats petites, com articles de revista, o números sencers en el cas de les revistes de la UAB, o anys en el cas dels cartells polítics.
15
16
* Es crea el registre bibliogràfic ric (per exemple, s'afegeixen les etiquetes 773).
17
* Es crea l'etiqueta 856 amb l'enllaç.
18
* Es generen les metadades Namaste (1,2,3,4).
19
* Es creen els fitxers .info amb les metadades administratives.
20
* Es genera el fitxer de paritat par2. Fitxer extra amb redundància d'un o més fitxers (típicament un 10%25). Si algun fitxer es corromp es pot recuperar fins al 10%25 de tots els fitxers.
21
* Generació md5 de tots els fitxers de tots els discos
22
23
* El control de versions permet la traçabilitat i recuperació de metadades administratives i fitxers. Només per al clariion. Pot actuar com a còpia de seguretat perquè es fan còpies diàries, una justament dins del mateix clariion, i 5 còpies dins del Volum-I.
24
* Dircloud, interfície de consulta dels AIP del DDD. Actua sobre tots els discos (clariion, volum-i, volum-ia).
25
* Els checksums es fan de  manera esporàdica en cas d'haver de reestructurar un gran volum de fitxers.
26
* Còpies de seguretat del clariion. Es fa una còpia al dia i la primera i la segona còpia en discos virtuals. Es fan còpies en cinta cada XXXX que s'envien fora de la UAB.
27
* Com a eines de gestió interna disposem d'un programa de gestió de fitxers, en aquest moment el més utilitzat és webadmin.php.
28
Per a la modificació de metadades disposem de la possibilitat d'editar les metadades descriptives en Marc21.
29
30
31 2 Ferran Jorba
h2. Paquet d'informació de diseminació (DIP - DDD)
32 1 Cristina Azorin
33
El DIP és l'interfície de consulta del DDD que permet les cerques i l'obtenció de resultats.
34
35
* No demanem als usuaris una identificació obligatòria, només fem la distinció si la màquina té IP de la UAB o no per a la consulta dels documents restringits.
36
* La interrogació de les dades es pot fer per les caselles de cerca i els resultats es poden obtenir en html generalment o en diferents formats d'exportació de dades (XML, Marc21...). Per al traspàs de grans paquets d'informació es poden generar automàticament a través del programa Bag-it.
37
* L'OAI és el sistema de diseminació per màquines, generalment recol·lectors (per exemple, Recolecta, Europeana...).
38
* Hi ha robots que recuperen les dades directament de les pàgines web en html, per exemple, Google.