Projecte

General

Perfil

Accions

Ampliació Satabeast maig del 2009

Objectiu

L'objectiu d'aquest informe és determinar la necessitat d'ampliació del sistema d'emmagatzemament basat en dispositius SataBeast. Donada la configuració dels dispositius que s'explica més endavant, la ampliació mínima és de 14 discs d'1 Tb. (7 per cada un dels dos dispositius) i resultarà en 5 Tb. disponibles per emmagatzemament. La ampliació de 14 discs té un cost de 7.308,00 euros IVA inclòs.

Argumentació econòmica en quant al sistema triat

El sistema SataBeast es va triar com a dispositiu per a emmagatzemar i preservar principalment els fitxers TIFF d'alta resolució resultat de la digitalització de fons seleccionat del Servei de Biblioteques.

Els documents es transformen a formats més petits i manegables (principalment PDF i JPG) per a la seva publicació al DDD (http://ddd.uab.cat/), però es conserven els d'alta resolució com a copia master per a la seva preservació a llarg termini. Degut al volum enorme d'aquest fons, a la seva immobilitat en el temps i al seu accés esporàdic , ni el sistema d'emmagatzemament ni el de backup estàndard de la universitat són adequats.

Es va escollir el sistema basat en armaris de discs SataBeast (http://www.nexsan.com/satabeast.php) per resultar el més econòmic i adequat en el moment que es va buscar una solució. Es tracta d'un armari de discs de molt alta densitat i amb redundància configurable (des de cap fins a RAID6), connectat o bé per fibra o iSCSI. És una opció senzilla i oberta que ens permet implementar-hi qualsevol opció software a posteriori. La capacitat màxima bruta és de 42 discs de 1 TB, que es redueix segons les opcions de RAID que s'hagin escollit (en el cas de la UAB, RAID6). A més, té l'opció !AutoMaid que fa que els discs s'apaguin mentre no es fan servir, el que representa un estalvi energètic important.

Com a comparació, aquest sistema és més econòmic que les cintes de backup que caldrien per emmagatzemar la mateixa quantitat de dades (amés la còpia en cinta i la seva custòdia no és viable).

Estat actual

A maig del 2009 tots els discs de cadascun dels armaris estan ja ocupats, en una proporció que va del 45% al 90%, segons el disc. Més concretament, 6,5 TB dels 9,2 TB (un 70%).

AmpliacioSatabeastMaig2009/volum-i_a2009m5.png?format=raw">http://wikis.bib.uab.cat/DDD/attachment/wiki/AmpliacioSatabeastMaig2009/volum-i_a2009m5.png?format=raw

Ara mateix, doncs no disposem de cap disc de maniobra per les reestructuracions i optimitzacions que cal fer a mesura que es consoliden les dades, i tampoc no tenim espai per a carregar-hi tots els discs que ja estan en revisió a les biblioteques. De fet, part dels continguts que darrerament hi hem copiat els hem hagut de repartir entre els dos armaris perquè no tenim espai per mantenir-ne una rèplica.

Tot i que hi ha restes de documents duplicats en més d'un disc del mateix Satabeast, el guany que obtindrem quan els haguem eliminat no serà significatiu (menys del 5% del total).

Previsió pels propers mesos

Aquest any es carregaran al Volum I:

  • 5 discs del projecte ANECA amb les col·leccions d'Humanitats (Arbonés, Calders, Goytisolo, Boletín de la Asociación Española de Escursiones i Butlletí de l'Associació Catalana d'Excursions = 2,5 TB aprox.
  • 3,5 Tb. resultat del projecte MEC - OAI.
  • Properes digitalitzacions i subvencions: Humanitats ha obtingut un ajut de digitalització de 30.000 €, però que dedicaran a digitalitzar de moment un 18.000 €. Tot just ha començat ara, amb la qual cosa és possible que no s'hagi de carregar fins el 2010. D'acord amb la màxima de 10.000€ = 1 TB, podem preveure 2 TB aprox. La BCHG preveu escanejar anualment unes 30.000 imatges, o uns 12.000€. Al marge hi ha l'Intercanvi amb la BNC Marca-Arca, però a hores d'ara no ho tenen quantificat.

Per altre banda cal preveure:

  • Espai per «sorpreses» i urgències inesperades que puguin sorgir (no serien les primeres, ni les últimes): un projecte "gros" és com qualsevol dels que hem fet, amb una despesa d'uns 30.000 €. Una càrrega ràpida d'aquests fons, pot suposar disposar de 3-4 TB lliures en un moment donat.
  • Espai de maniobra en forma d'algun disc lliure: potser amb els dos discos per màquina de reserva-sorpreses-maniobra, serien suficients.

Una ampliació de 14 disc és necessària abans o immediatament després de l'estiu. Una segona ampliació s'haurà de fer per completar els plans previstos. La data en que caldrà fer la segona ampliació depèn del ritme de digitalització i incorporació dels fitxers.

Nivell de redundància del sistema

Hi ha una còpia de tota la informació emmagatzemada a cada un dels dos dispositius. Aquesta mesura permet la tolerància a un desastre que afectés a la totalitat d'un dispositiu, inclosa la errada humana (la sincronització de continguts es fa de forma diferida per poder tirar enrere canvis incorrectes). Així que sigui possible un dels dos dispositius s'instal·larà a una ubicació física diferent perquè evitar que sigui afectat per un desastre local.

Dins de cada dispositiu s'han configurat formacions de 7 discs en RAID6 (tolerància a la fallada concurrent de dos discs com a màxim). Per cada conjunt de 7 discs d'1 Tb. queden disponibles 5 Tb.

A cada dispositiu es reserven dos discs hot spare. Aquests discs substitueixen immediatament un d'avariat del RAID amb l'objectiu de reduir el temps de reconstrucció del RAID després de l'avaria d'un dels discs.

Argumentació econòmica respecte a la necessitat d'emmagatzemar aquesta informació

La experiència fins ara és que la digitalització que resulta en 1 Tb. de dades a emmagatzemar costa uns 10.000 euros. Un disc d'un Tb pel SataBeast costa uns 500 euros IVA inclòs. Caldria repercutir el cost dels discs redundants i del propi armari, però sense fer aquestes operacions és clar que el cost de preserva és molt inferior al de tornar a digitalitzar els documents.

Actualitzat per Ferran Jorba fa quasi 14 anys · 1 revisions