Previous: Table des encadrés
Up: Installx 101
Next: 2 Exemples d'installation
  Contents
Subsections
Les remarques ci-dessous ont été inspirées par "quelques
années" de pratique. Elles sont largement indépendantes du
système utilisé. Les indications
sont des indications de
datation (système en cours d'installation à ce moment-là).
- Lors d'une action sur le matériel, couper l'interrupteur placé sur
l'alimentation électrique (pas celui en façade), car bien des choses
restent sous tension (fonction Wake on Lan par exemple). D'ailleurs,
il y a souvent une led à côté des barrettes mémoire qui sert de rappel
à l'ordre.
- Lors d'un changement de carte graphique, déconnecter les disques afin
de pouvoir rebooter "en aveugle" autant que de besoin
(hardware setup, AGP 4x, wait states etc.). Ne pas être prétentieux,
il est bien rare que cela fonctionne du premier coup.
- Lors d'une intervention majeure sur le système, faire une copie de
/root dans /home/root, puis déconnectez le disque
contenant les données (car -bien entendu- vous n'avez pas eu la stupidité
de placer le répertoire /home sur le même disque que le système).
- Le plus rapide est toujours de procéder à une installation
from scratch, sur un nouveau disque (cf Subsection A.2).
Ne montez l'ancien disque qu'en lecture seule, et encore quand vous
commencez à avoir le contrôle sur le nouveau système.
- Utiliser exclusivement l'installation à partir d'un DVD bootable (et
jeter les machines qui ne permettent pas cela). Il y a toujours quelque
chose qui foire, et il est insupportable de jouer aux disquettes,
aux changements de CDROM, et puis quoi encore (cf Subsection A.1).
Faire une copie du DVD, et archiver.
- Bien entendu, vous avez une copie de tous les fichiers de configuration
que vous avez modifié, avec la liste des raisons pour lesquelles...
(batch qia~ ). Prendre l'habitude de ne rien
modifier directement, mais d'écrire des batchs qui feront les modifications.
Cela gagne un temps précieux car cela permet de comprendre ce qui
ne marche plus.
Les ventilateurs sont en permanence une source de bruit, et occasionnellement
une source de pannes. Les éléments de comparaison sont la vitesse
(rpm), le débit d'air (1 m3/m = 35.315 cfm) et le niveau de bruit
(dB). Pour les ventilateurs à vitesse variable, c'est principalement
le bruit qui augmente avec la vitesse. La grande méthode pour diminuer
le bruit est d'augmenter la taille, permettant de diminuer la vitesse
de rotation tout en restant efficace. La TAB. 1
donne quelques chiffres à ce sujet (
).
TAB. 1:
Quelques données sur les ventilateurs
|
|
Autre cause de bruit : la poussière qui se colle sur les
pales et donne du balourd à la partie tournante. Il est indispensable
de déposer et nettoyer tous les ventilateurs lors de la visite annuelle.
1.4 Commutateur KVM
KVM = Keyboard Video Mouse. Il s'agit de commander plusieurs
ordinateurs à l'aide d'un seul ensemble Écran Clavier Souris. Plusieurs
tentatives bancales conduisent à "mettre le prix"
pour une solution efficace. En tout état de cause, les taux de rafraîchissements
actuellement utilisés nécessitent des câbles vidéo blindés (avec ferrite).
- Permutateur manuel Écran_15, Clavier_gros, Souris_série.
- Le passage à écran utilisant un taux de rafraîchissement plus élevé
engendrait des traînées (écho visuel) insupportables, y compris avec
des câbles blindés.
- Commutateur usb Écran_15 et 4 ports usb. Modèle "Pearl master
View" 150€+
câbles à 4€. Simplifie
le câblage (un fil de moins par ordinateur).
- La permutation est lente : il faut que l'ordinateur connecté découvre
la présence des périphériques usb.
- Cela est encore plus vrai sur les machines unix : il faut attendre
quatre bips (master-view, souris, clavier_cherry, port_cherry) avant
de toucher au clavier sinon le barnum usb tombe en panne (et il n'y
a plus qu'à rebooter depuis une autre machine.
- Et en plus, il se crée un "empilement de cadavres"
de gestionnaires usb, qu'il faut tuer un par un avant que le reboot
puisse avoir lieu. Plusieurs cas de plantage total.
- Commutateur Écran_15, clavier_fin, souris_ps2_série. Modèle "Black
Box ServSwitch personal 4 ports" 270€+
câbles
pieuvre à 18€.
- Commutation entre les ordinateur par le clavier
,
où la lettre est Q, B, C, D (clavier us...). Possibilité d'empiler
et de contrôler 16 postes.
- Pas rencontré de problèmes à ce jour.
- Il y une commande de resynchronisation de la souris :
when
mouse jumps and hugs screen
when
a ps/2 mouse is inoperable
when
an intelli-mouse is inoperable
Ce composant assure trois fonctionnalités différentes.
- Protection contre les surtensions : absolument indispensable.
- Continuation en cas de micro-coupure : nécessite une puissance suffisante
pour tenir compte du nombre d'ordinateurs et des accessoires (switchs).
- Permettre un shutdown propre en cas de coupure de courant. Cette fonctionnalité
nécessite soit une automatisation du processus (=pas encore étudié)
soit, au minimum, une puissance assurant un délai suffisant pour procéder
à la main : en particulier l'écran doit lui aussi rester fonctionnel.
Il faut, de temps à autre, procéder à un test du comportement des
onduleurs, ordinateurs éteints et charge assurée par un groupe de
lampes à incandescence de puissance adaptée.
- Lorsqu'un onduleur ne fonctionne plus, le deuxième composant à tester,
après le fusible, est la batterie. Où peut-on trouver ce genre de
batteries ?
- Pourquoi un UPS 400 (ancien) et un UPS 800 (plus récent) ont-ils la
même batterie 12V, 7VA ?
- Que se passe-t-il si l'on remplace la batterie sèche par une batterie
de voiture ?
Le plan d'affectation des disques est une chose sensible. Il faut
tenir compte des comportements du BIOS, et des divers systèmes
d'exploitation.
- Les lecteurs IDE de CDROM ou de ZIP ne sont pas
reconnus par les "gestionnaires RAID" fournisseurs
de contrôleurs IDE supplémentaires (composants "promise").
Il faut donc positionner ces lecteurs sur les gestionnaires par défaut,
et déporter les "vrais" disques durs sur les gestionnaires
supplémentaires.
- Le BIOS considère que les disques gérés par des cartes IDE-RAID
ou des cartes SATA sont des disques SCSI.
- Une stratégie intéressante consiste à placer le disque Unix principal
sur ordinary primary master (nommé hdd-0 dans le BIOS) et le
disque principal windows sur promise primary master (nommé scsi dans
le BIOS). On déclare alors comme ordre de boot : CDROM,
hdd-0, scsi. Comme cela, le disque winxx boote automatiquement lorsque
le disque linux est non fonctionnel (pas encore écrit, ou enlevé).
- En tout état de cause, la led "activité disque"
doit être éteinte dans les périodes inactives. Son maintien dans l'état
allumé signale le dysfonctionnement d'un composant. Dans le cas IDE,
cela se répercutera sur l'autre composant monté sur le même câble.
- Attention aux cavaliers des disques durs. Sur les disques WD400BB,
le cavalier en position "DS" code pour master avec
slave présent. Si le slave n'est pas présent, le disque n'est pas
reconnu. Il faut donc enlever le cavalier.
- (
) Les disques ultra-ata nécessitent des câbles 80 fils.
Il semble que les câbles ronds sont "cable select"
: le master doit impérativement être en bout de câble et le slave
en position intermédiaire.
- (
) Disques sata... et incident.
- Remarques sur les DVD bootables. Ces évènements n'ont pas donné
lieu à une étude de causes (il était plus rapide de se défaire du
composant en cause) :
- Pour une cause inconnue, le boot sur dvd échoue, sur deux machines
distinctes, avec un lecteur DVD "ata 33"
(qui permet néanmoins de booter depuis un CDROM).
- Le boot sur DVD fonctionne aussi bien avec un lecteur "pio
4".
- Un autre lecteur DVD est reconnu comme "pio 4"
sur une machine et "ata 100" sur une autre (boote
dans les deux cas).
- Remarque sur les lecteurs de disquette : une tentative pour utiliser
un câble "raccourci" a échoué. Une analyse des causes
reste à faire.
- Problème d'identification des dvd, cdrom etc. Ce problème est dû à
un mauvais lien /dev/dvd -> hdd au lieu de /dev/dvd -> /dev/hdd...
quand ce n'est pas /dev/dvd -> /dev/hdh.
1.7 Cartes et disques IDE-RAID
Ne sautez pas cette section sauf si vous êtes absolument sur de ne
pas vouloir installer à un moment ou un autre une grappe raid sur
votre ordinateur.
- Il est important de pouvoir démarrer le système en ayant démonté physiquement
les disques réservés aux données. Par conséquent, il faut que le disque
système soit toujours placé à l'endroit adéquat pour être appelé par
le même nom UNIX (par exemple /dev/hda) et cela que les disques
de données soient ou non reliés à la carte mère.
: si l'on utilise des disques SATA, leur noms /dev/sdx
dépendent non seulement de leur place matérielle mais aussi de la
présence ou non des disques situés avant eux (comportement habituel
des périphériques SCSI).
- La commande hwinfo fournit trois désignations. Par exemple :
/dev/sdb
/dev/disk/by-path/pci-0000:03:0a.0-scsi-1:0:0:0
/dev/disk/by-id/SATA_Maxtor_6Y160M0_Y45N3FFE
Comment utiliser un mécanisme de ce genre pour décrire les disques
?
: le BIOS et le kernel 2.4.19-4GB ne sont
pas toujours d'accord sur la façon de numéroter les disques IDE.
Ceci se produit en particulier lors de l'utilisation "softraid"
des cartes "IDE-RAID" vendues par CMD
TECHNOLOGY INC. En principe, ces cartes bootent juste après la carte
mère et détectent les disques présents (et proposent une utilisation
"hardraid"). En fait il y a deux modèles (1095:0649
et 1095:0680), ayant des comportements différents.
- Chaque modèle "ide-raid" est reconnu (au boot) sur
moonlight, tandis que la pci0649 n'est pas reconnue au boot sur madras.
- Bien pire : sur moonlight, les disques reliés à cette carte apparaissent
comme /dev/hde ... /dev/hdh, c'est à dire après les disques reliés
à la carte mère, tandis que sur madras, les disques reliés aux cartes
deux cartes pci0680 viennent se placer en /dev/hda.../dev/hdd et /dev/hde.../dev/hdh,
c'est à dire devant les disques reliés à la carte mère qui se placent
donc en /dev/hdi../dev/hdL. Pourquoi ?
- Il convient de signaler que sur madras les options de boot présentée
par le bios sont
- disque CDROM
- disque scsi (et alors, boot du premier disque de la première carte
IDE-RAID)
- disque ide : cette option ne donne que absent/désactivé (cause probable
du problème).
- Par conséquent, le disque système (sur madras) doit être connecté
à la première carte IDE-RAID... lorsqu'il y a une carte IDE-RAID,
et sinon reconnecté sur la carte mère.
- Performances : il ne faut pas plus d'un disque par nappe ide. Cela
figure dans les how-to (http://unthought.net/Software-RAID.HOWTO/Software-RAID.HOWTO.html),
et cela est confirmé par l'expérience. Cette remarque ne concerne
pas seulement le service normal, mais aussi (voire surtout) la reconstruction
des grappes raid... et il y en a souvent.
- Il est préférable que la géométrie logique des futurs disques raid
soit identique à leur géométrie physique. S'en assurer par la commande
hwinfo -disk.
-
- # hwinfo -disk
Unique ID: nBbg.jqPzDkLNGs7
Model: "WDC WD400BB-00DEA0"
Revision: "05.03E05"
Serial ID: "WD-WCAD12736912"
Device File: /dev/hda
Geometry (Physical): CHS 77545/16/63
Geometry (Logical): CHS 4865/255/63
Attached to: #4 (IDE interface)
- En cas de différence, supprimer toutes les partitions des disques
concernés, ainsi que les descriptions hardware. Ne pas hésiter à faire
du ménage dans les descriptions, c'est à dire virer les descriptions
de matériels qui ne sont plus présents. Ne pas oublier de rebooter
juste après cette manoeuvre (sinon le système se souvient de la description
et recrée le fichier).
- Pour la
, ces descriptions se trouvaient dans le répertoire
/var/lib/hardware/unique-keys et la commande hwscan -list | grep disk | grep -v storage | sort
permettait d'en récupérer la partie utile.
- Pour
, ces descriptions sont dans /var/lib/hardware/udi/org/freedesktop/Hal/devices
et le batch qyh_docs_hardware permet d'en récupérer la partie
utile.
- Il est commode de créer les partitions physiques à l'aide du partitionneur
YaST2, c'est à dire kdesu kcmshell YaST/System/yast2-storage-Partitioner.
Une seule partition sur chaque disque, de même taille. L'idéal est
évidemment d'avoir des disques identiques (deux disques actifs pour
raid-1, trois disques actifs ou plus pour raid-5 et un disque spare).
Pour chaque partition, choisir le type linux raid (=0x), option ne
pas formater.
- Utiliser YaST2 pour créér la partition raid /dev/md0. Ne
pas se préoccuper pour l'instant des disques spare : inclure seulement
les disques actifs. On constate la création d'un fichier /etc/mdadm.conf
contenant la signature identifiant les partitions appartenant à la
même grappe.
- Utiliser YaST2 pour formater cette partition /dev/md0 (avec
ext3, anciennement reiserfs) puis la monter en /home.
- Le gestionnaire de barnum est maintenant (
) mdadm.
Les anciens gestionnaires tels raidtools ou mkraid
et utilisant le fichier /etc/raidtab sont hors maintenance.
Les oublier complètement.
- La documentation howto est totalement obsolète (2004, alors
que l'on est en 2007). Les pages man ne sont pas d'une grande
clarté. Le web est encombré de vieilleries et de l'habituel bruit
blanc des listes de propagation d'erreurs. Tout relire plusieurs fois
et ne faire des essais que sur des systèmes vides (=sans données à
écraser). On pourra consulter http://www.linuxdevcenter.com/pub/a/linux/2002/12/05/RAID.html.
- Pour ajouter un disque spare à une grappe, "un peu"
de recherche conduit à http://www.issociate.de/board/goto/1024674/
et à
mdadm -manage /dev/mdx -add /dev/sdxx
En effet, ajouter un disque à une grappe dont tous les disques devant
être actifs sont effectivement actifs a pour effet de mettre le nouveau
disque en réserve.
- Pour que le nouveau disque vienne s'ajouter à la liste des disques
actifs (d'une grappe raid1), donnant lieu à trois images-mirroir de
la même partition, il aurait fallu modifier ce nombre par :
madam -grow /dev/mdx -m3
- Requête de base : cat /proc/mdstat. La lettre U veut dire "up"
(=cela marche), tandis que le "_" signale une panne
ou bien une reconstruction en cours. Dans ce dernier cas, un état
d'avancement est donné.
- Description d'une grappe : mdadm -query -detail /dev/md0
- L'assemblage se fonde sur la comparaison des UID et du nombre d'événements
traités par chaque disque. Exemple :
UUID : 0486bda4:3f72fcce:cac66815:43d988f8
Events : 0.7255222
- Le batch qyR fait tout cela (). Imprimer toutes ces informations et
les mettre "en lieu sûr". Lorsque vous en aurez
besoin, le disque ne sera plus utilisable.
- Gérer les problèmes de façon paranoïaque. Si une grappe raid se désynchronise
(cable débranché) il n'est pas impossible que le disque actif subisse
un problème pendant ce temps là. Il ne faut donc pas resynchroniser
les deux disques, mais monter un disque vide avec le disque le plus
actuel (et garder l'autre disque pour un remontage éventuel en cas
de panne).
- Plus généralement, une grappe raid a comme seul objectif ... faire
face à la panne d'un seul disque. La reprise sur plantage ou sur panne
de courant n'est pas assurée.
- L'option -force de mdadm est soumise à un double
verrouillage... mais finit par être exécutée (perte définitive des
données non sauvegardées en cas de fausse manoeuvre).
- Il est INDISPENSABLE de procéder à plusieurs "exercices
d'incendie" pour bien vérifier ce qu'il faut faire pour remplacer
un disque tombé en panne (c'est le but de raid1/raid5, n'est-ce pas
?). La commande "raidhotadd" est
mdadm -manage /dev/mdx -add /dev/hdxy
à exécuter sur un groupe démarré (mdadm -As) mais démonté
(umount). Le disque remplaçant doit évidemment être configuré au préalable.
Compter une heure d'écriture durant laquelle les performances machine
seront à peu près nulles.
- Tout cela repose sur le superbloc figurant en tête de chaque partition.
Que faire quand ce bloc est corrompu (ancienne commande de mdadm ?).
- Est-ce bien vrai que l'on peut rebrancher n'importe comment les différents
disques d'une même grappe ?
- Pour commencer, installer le disque à traiter sur une autre machine
(principe général : les données ne seront pas redonnées).
- cp /dev/malheur /root/dir-copy
mount -t type -o loop /root/dir-copy /mnt
Objectif : disposer d'une copie utilisable sans risques
- Le partitionnement doit être effectué de façon réfléchie, car il est
difficile à modifier par la suite. Évidemment, on ne sait pas à quoi
réfléchir avant d'avoir eu des problèmes...
- Un objectif prioritaire est de séparer les données de tout le reste.
Un disque supplémentaire coûte 100€. Combien coûtent les
données perdues ? Par ordre décroissant de coût (et de sécurité) on
peut placer le répertoire /home sur
- une grappe raid, en mode 5 (stripped+mirrored) avec 3+ disques IDE
ou SATA
- une grappe raid, en mode 1 (mirrored) avec 2 disques IDE ou
SATA
- un disque IDE séparé
- une simple partition sur le disque système.
Pour le reste, un disque ide rapide est suffisant.
- Partitions : tout ce qui boote doit être en début de disque (avant
les limitations diverses), et il n'y a que quatre partitions (primaires)
possibles. Dans l'ordre des partitions :
- La meilleure méthode : swap, racine (avec /boot et /user
inside)
Une grappe raid pour /home
Un autre disque pour winxx
- Ancienne meilleure méthode (
) : /boot (circa 16Mo),
swap, racine... etc
- Alternative sans winxx : /boot (circa 16Mo), swap,
racine et /home.
- Alternative avec winxx : /boot (circa 16Mo), swap,
winxx, partition étendue
Deux partitions logiques : une pour racine, une autre pour
/home.
Caveat : les numéros des partitions étendues changent en cas de suppressions
: ne pas leur donner exactement la même taille, cela permet de les
distinguer.
TAB. 2:
Sans disque RAID.
|
|
TAB. 3:
Avec disques RAID.
|
|
Rappel: la seule partie utile d'un tel barnum est constituée par les
données, c'est à dire le répertoire /home (qui, bien sûr, contient
une copie à jour de /root et de /var). Pour utilisation avec une grappe
raid, il peut être utile de laisser une partition "home-like"
sur le disque système, pour permettre une sauvegarde supplémentaire
des données fragiles.
- Résidus archéologiques
- la description de /hdi1 dans madras est différente de celle des autres
disques (tous identiques). Voir pourquoi.
- /dev/sda sur mona est un ''gros disque'', utilisé en remplacement
d'un disque en panne. Qu'est-ce que la partition hyber ???.
- les disques /dev/hde et /dev/hdg de moonlight commencent par une partition
de un cylindre. Pourquoi ???.
- (jusqu'à
) Choix du file system = reiserfs. L'implémentation
des fichiers "ext2" avec le système de liens par
inodes est fragile. Il suffit d'une coupure de courant pour que le
disque devienne illisible. Le système reiserfs semble plus robuste
de ce point de vue (ne pas y croire de trop). En tout cas, il est
plus facile à remonter après plantage.
- (
) Le file système par défaut est maintenant "ext3".
Nous avons suivi cette recommendation sans plus étudier le pourquoi
de ce changement.
- Il est indispensable de recueillir l'identifiant numérique des matériels
et de le recopier sur les manuels, les boites des drivers, etc. Se
méfier des noms fantaisie qui ne seront pas reconnus. On pourra consulter
http://pciids.sourceforge.net/iii/?i=xxxx
pour une référence
xxxx:yyyy.
- Certains bios affichent les identificateurs vendeur:matériel des différentes
cartes. Dans tous les cas, noter attentivement tout ce qui apparaît
lors du post (Power On Self Test) et rassembler toute la documentation
disponible sur les matériels.
- Il est raisonnable de commencer par une installation sous winxx afin
de vérifier le bon fonctionnement des matériels (attention aux délais
de retour, qui sont très courts, et aux revendeurs qui ne veulent
pas entendre parler des OS exotiques). En profiter pour récupérer
le fichier system.prn par My_computer/Properties/Print_All -> Imprimante/TexteSeulement,
puis batch ad hoc.
- Les identificateurs vendeur:matériel sont collectés dans la section
pci de la base de registre. Extraire tout cela et le joindre aux résultats
de system.prn.
- Après coup, on peut retrouver ces informations par la commande
hwinfo -pci | grep ": PCI"
(incorporée dans qyh_docs_hardware)
- Plus généralement, la commande /usr/sbin/hwinfo -item
donne l'accès aux items :
-
- all, bios, braille, bridge, camera, cdrom, chipcard, cpu, disk, dvb, floppy,
framebuffer, gfxcard, hub, ide, isapnp, isdn, joystick, keyboard, memory,
modem, monitor, mouse, netcard, network, partition, pci, printer, reallyall,
scanner, scsi, smp, sound, storage-ctrl, sys, tv, usb, usb-ctrl
Previous: Table des encadrés
Up: Installx 101
Next: 2 Exemples d'installation
  Contents
douillet@ensait.fr
2007-12-06