Incidència #7164
tancatAturada del servidor Taltabull
Descripció
Aturada per actualitzar la versió del sistema operatiu. Calculem que cap a les 10, si no hi ha hagut incidències, tornarà a estar en marxa. Això afectarà els serveis de prova, en concret:
• https://ddd-test.uab.cat
• https://traces-test.uab.cat
• https://ifmuc-test.uab.cat
• https://wikis-test.bib.uab.cat
I també:
• https://volum-i.uab.cat
En principi no hauria d'afectar el funcionament de les aplicacions, llevat de https://wikis-test.bib.uab.cat, que quedarà temporalment desactivat. En els propers dies instal·larem en proves la versió 5.0 del Redmine amb aquesta adreça de test i que, entre altres millores, hauria de permetre l'autenticació via el SSO de la UAB.
Tasques relacionades 2 (0 obertes — 2 tancades)
CA Actualitzat per Cristina Azorin fa quasi 4 anys
Taltabull trigarà més del previst a estar disponible. Els problemes que tenim tenen a veure amb mòduls de Python (python-apache, python-mysql i python-ldap) que no estan disponibles per a Python2 (la versió que necessita Invenio), però sí per a Python3.
S'han trobat problemes amb els discs del sistema de Taltabull, no sembla un problema de hardware sinó que en algun moment de reiniciar Taltabull alguna cosa s'ha desincronitzat (no es veuen els discs locals)
CA Actualitzat per Cristina Azorin fa quasi 4 anys
Sembla ser que el disc està intacte i el problema només està en el sector de boot, que permet transferir el control al sistema operatiu perquè arranqui. Ara estan mirant de reconstruir aquest sector de boot perquè pugui arrencar normalment.
FJ Actualitzat per Ferran Jorba fa quasi 4 anys
- Estat ha canviat de Creada a Tancada
Entre una cosa i l'altra hem trigat una setmana a tornar a tenir Taltabull operatiu un altre cop.
Per algun motiu esotèric que encara no sabem, no hi havia manera de recuperar el sector de boot original i la recuperació dels discs raid (en mirall) tal com estava. Per tant, els tècnics van haver de reinstal·lar-lo i reconfigurar-los de nou, recuperar de còpia de seguretat, i tornar a refer les connexions al Volum-I (VNX 500) i al Satabeast (rèplica del Volum-I).
Deixem una setmana d'estabilitar-ho tot abans de tornar a intentar l'actualització del sistema operatiu, de Debian 10 a Debian 11, que va ser l'origen d'aquest incident que no hauria d'haver passat.
CA Actualitzat per Cristina Azorin fa quasi 4 anys
- Data de venciment ha canviat de 11-05-2022 a 18-05-2022
CA Actualitzat per Cristina Azorin fa quasi 4 anys
- S'ha afegit copiada a Incidència #7246: Aturada del servidor Taltabull - tercer intent
CA Actualitzat per Cristina Azorin fa quasi 4 anys
- S'ha afegit relacionat amb Incidència #7245: Aturada del servidor Taltabull - segon intent