question pour les plus forts (que moi) en linux parmi vous

  • Commercial
  • Microsoft Outlook
Ça arrive semi régulièrement, sur une de mes machines linux seulement, et je
comprend pas pourquoi.



Un moment donné mon file system tombe en « read-only » et je suis forcé de
rebooter et de faire un fsck à la main.



Je sais pas trop comment ni pourquoi.



Généralement, je m'en rencds compte en faisant un commit via CVS qui me
retourne un truc du genre :



The server reported an error: Read-only file system
can't create temporary directory /tmp/cvs-serv16215



Lorsque je vérifie sur le serveur, tout le filesystem au complet est
read-only.



Je sais pas trop où regarder pour comprendre ce qui se passe.



Any help appréciée.
 

Re: question pour les plus forts (que moi) en linux parmi vous

  • Canada
  • GNU/Linux
  • Mutt
  • FOAF
  • PGP

> Un moment donné mon file system tombe en « read-only » et je suis forcé de
> rebooter et de faire un fsck à la main.
> Je sais pas trop où regarder pour comprendre ce qui se passe.


Fort anormal. Je regarderais dans les journaux (/var/log/{messages,syslog}) ce
qui provoque la mise en lecture seule.

Généralement, un filesystem est placé en lecture seule au _démarrage_, lorsque
fsck n'a pu automatiquement réparer des erreurs et demande une intervention
humaine. Une fois booté, est ce que le filesystem est vraiment read-write?

Comme il s'agit de /tmp, c'est peut-être une maudite cochonnerie comme tmpfs ou
autre solution à des non-problèmes. Est-ce que /tmp est _vraiment_ sur le
disque dur? faire `mount` pour savoir.



--
--====|====--
--------================|================--------
Patrice Levesque
http://ptaff.ca/
wayne(à)ptaff.ca
--------================|================--------
--====|====--
--
Pièces jointes
 

RE: question pour les plus forts (que moi) en linux parmi vous

  • Commercial
  • Microsoft Outlook
*tout* le filesystem est en read-only. Impossible d'écrire où que ce soit,
même lorsque logué sous "root".

C'est très curieux. Tous mes mounts sont "rw". Mais peu importe
l'opération de disque, je me fais dire "Read-only file system"

À ce que je saches, la machine n'a pas rebooté...

/var/log/messages ne dit rien d'intéressant. Évidemment, puisque le log est
devenu read-only...

La seule indice est que le dernier update du log est à 3h18 (am) le 16
avril...

Ce qui correspond, il me semble à l'heure settée pour les cron tasks.

Le 16 étant dimanche... voyons voir...

Y'a ça qui roule à chaque semaines: /bin/nice /usr/sbin/makewhatis
Y'a un tar de cvs qui se fait à chaque jour
Y'a un mysql dump qui se fait à chaque jour
Y'a un sync avec dyndns (ddclient) à chaque jour
Y'a un update de slocate qui se fait à chaque jour itou (nice
/usr/bin/updatedb)

Ça revient régulièrement... mais pas à chaque semaine.

Plutot curieux.
 

Re: question pour les plus forts (que moi) en linux parmi vous

  • Canada
  • GNU/Linux
  • Mutt
  • FOAF
  • PGP

> *tout* le filesystem est en read-only. Impossible d'écrire où que ce soit,
> même lorsque logué sous "root".


Bon. D'après mes lectures,

1) Vérifier avec `dmesg` s'il y a quelque information sur des problèmes de
disque;

2) Il existe une option à mount pour certains types de filesystem (ext2, ext3
entre autres), qui est « errors=remount-ro » qui tendrait à provoquer le mode
read-only quand il y a des erreurs disque (ce qui est pas mal safe comme
comportement). Est-ce que le disque est monté avec cette option? ce serait
normalement indiqué :

a) Dans /etc/fstab, et/ou

b) En faisant `mount`, dans les options (à la toute fin, entre
parenthèses), et/ou

c) En faisant `tune2fs -l /dev/...` où ... représente ta partition (hda1?
sda1?), tu auras une ligne « Errors behavior »


C'est tout ce que je vois qui pourrait provoquer un remount en read-only : ça
sent le disque en train de mourir. Si avec les deux points ci-haut ça donne
pas plus d'information, serais-tu assez fin pour poster le output de `mount`
ainsi que de `lspci -v`? y'aurait peut-être un problème de contrôleur de disque
derrière ça. Je suis pas un expert en hardware mais en me donnant des
mots-clefs ça facilite la googlisation.



--
--====|====--
--------================|================--------
Patrice Levesque
http://ptaff.ca/
wayne(à)ptaff.ca
--------================|================--------
--====|====--
--
Pièces jointes
 
RE: question pour les plus forts (que moi) en linux parmi vous
  • Commercial
  • Microsoft Outlook
Dmesg dit rien de bon (seulement EXT3-fs error (device hda3) in
start_transaction: Journal has aborted)

Fstab est très basic (avec les training wheels, désolé pour le wordwrap):

# NOTE: If your BOOT partition is ReiserFS, add the notail option to opts.
/dev/hda1 /boot ext2 defaults
1 2
/dev/hda3 / ext3 noatime
0 1
/dev/hda2 none swap sw
0 0

/dev/cdroms/cdrom0 /mnt/cdrom auto noauto,user
0 0
#/dev/fd0 /mnt/floppy auto noauto
0 0

# NOTE: The next line is critical for boot!
none /proc proc defaults
0 0

# glibc 2.2 and above expects tmpfs to be mounted at /dev/shm for
# POSIX shared memory (shm_open, shm_unlink).
# (tmpfs is a dynamically expandable/shrinkable ramdisk, and will
# use almost no memory if not populated with files)
# Adding the following line to /etc/fstab should take care of this:

none /dev/shm tmpfs nodev,nosuid,noexec
0 0



tune2fs est nouveau pour moi... voyons voir... le bobo est sur hda3, donc:

anakin ~ # tune2fs -l /dev/hda3
tune2fs 1.38 (30-Jun-2005)
Filesystem volume name: <none>
Last mounted on: <not available>
Filesystem UUID: 35d2b537-7e15-4ef2-b8f7-56c45fd8102e
Filesystem magic number: 0xEF53
Filesystem revision #: 1 (dynamic)
Filesystem features: has_journal filetype needs_recovery sparse_super
Default mount options: (none)
Filesystem state: clean with errors
Errors behavior: Continue
Filesystem OS type: Linux
Inode count: 1202944
Block count: 2403324
Reserved block count: 120166
Free blocks: 1294982
Free inodes: 908631
First block: 0
Block size: 4096
Fragment size: 4096
Blocks per group: 32768
Fragments per group: 32768
Inodes per group: 16256
Inode blocks per group: 508
Filesystem created: Wed Jun 1 05:49:04 2005
Last mount time: Mon Apr 3 12:53:36 2006
Last write time: Sun Apr 16 03:18:51 2006
Mount count: 4
Maximum mount count: 32
Last checked: Sun Mar 12 02:07:20 2006
Check interval: 15552000 (6 months)
Next check after: Fri Sep 8 02:07:20 2006
Reserved blocks uid: 0 (user root)
Reserved blocks gid: 0 (group root)
First inode: 11
Inode size: 128
Journal inode: 8
First orphan inode: 113806
Default directory hash: tea
Directory Hash Seed: 0847bfa6-9617-44c3-b58f-7722cb6058ad
Journal backup: inode blocks


"clean with error", ouaip. Quand ça arrive, je fais un fsck à bras et tout
est bien (sauf /dev/null qui reste généralement read-only et qu'il faut que
j'update (??))

"Last mount time" semble indiquer (si je n'mabuse) que j'ai pas rebooté
depuis le 3 avril. Ce qui correspond avec mon souvenir.

"Last write time" indiquerait l'heure du bobo.

Ce qui est weird, c'est que tout revire en read-only sans reboot - sans
unmount/remount.

Je lui avais fait faire des scans de disque plus sévères, voilà à peu près
un mois, en me disant que j'allais y trouver des bad sectors. Rien trouvé.

Très curieux :(
 
Re: question pour les plus forts (que moi) en linux parmi vous
  • Canada
  • GNU/Linux
  • Mutt
  • FOAF
  • PGP

> "clean with error", ouaip. Quand ça arrive, je fais un fsck à bras et tout
> est bien (sauf /dev/null qui reste généralement read-only et qu'il faut que
> j'update (??))


Comme un fsck est dû, pourrait-on lire le output de `fsck -V /dev/hda3`? Comme
c'est récurrent (et je trouve weird l'histoire de /dev/null), y'a peut-être un
problème qui n'est jamais réglé avec fsck? Ça expliquerait pas comment le fs
tout à coup devient read-only mais tout indice est bon.

Si tu savais pas, tu peux switcher entre read-only et read-write sur une
partition en faisant :

mount -o remount -o ro /dev/hda3 # mettre en read-only
mount -o remount -o rw /dev/hda3 # mettre en read-write




--
--====|====--
--------================|================--------
Patrice Levesque
http://ptaff.ca/
wayne(à)ptaff.ca
--------================|================--------
--====|====--
--
Pièces jointes
 
RE: question pour les plus forts (que moi) en linux parmi vous
  • Commercial
  • Microsoft Outlook
J'ai essayé un remount et ça me donne:
block device /dev/hda3 is write-protected, mounting read-only

Je pourrai tenter de garder l'output du fsck quand j'aurai accès console
demain...
 
Re: question pour les plus forts (que moi) en linux parmi vous
  • Canada
  • Mozilla Thunderbird
Eric Maziade wrote:

> J'ai essayé un remount et ça me donne:
> block device /dev/hda3 is write-protected, mounting read-only


Ouf.. ca me semble etre un probleme hw.

Au cas que ce serait soft, est-ce que tu pourrais donner plus de details
sur la machine et l'os? C'est quelle distribution de GNU/Linux? Quelle
version du noyau (fait uname -a)?

Ciao,


--
+-------------------------------------------------------+
| |
| Stefan Michalowski, M. Sc. |
| ------------------ |
| Email: illmnec(à)sympatico.ca |
| GPG Key: http://screamerone.zapto.org/k.asc |
| ---------------------------------- |
| "Provider of Open Paradigm Shifts" |
| |
+-------------------------------------------------------+
 
Tu ne semble pas etre le seul a avoir eu ce probleme
  • Canada
  • Mozilla Thunderbird
j'ai google ton message d'erreur, et j'ai trouve ca:
http://lists.debian.org/debian-user/2003/07/msg02733.html

date de 2003...

ciao,


--
+-------------------------------------------------------+
| |
| Stefan Michalowski, M. Sc. |
| ------------------ |
| Email: illmnec(à)sympatico.ca |
| GPG Key: http://screamerone.zapto.org/k.asc |
| ---------------------------------- |
| "Provider of Open Paradigm Shifts" |
| |
+-------------------------------------------------------+
 
RE: question pour les plus forts (que moi) en linux parmi vous
  • Commercial
  • Microsoft Outlook
Ça me donne (comme ça m'a donné les dernières fois)
inodes that were part of a corrupted orphan linked list found

ça, ça me semble nouveau:
inode bitmap differences -113800 -(-113805--113806)
free inodes count wrong for group #7 (16224, counted=16227)
free inodes count wrong (90861, counted=908624)

Ce qui me faisait croire (et me fait recroire) que j'ai peut-être un bad
sector... J'en avais pas trouvé (je lui avais fait faire je me souviens
plus quelle commande (prob. un fsck plus thorough). Ça avait pris quelques
heures, mais rien trouvé. Je suis pas trop sûr que j'ai employé la bonne
technique pour détecter ça.

Dans le cas-où je finis par acheter un nouveau HD, je peux clôner le HD
courant? J'ai pas envie de me taper une journée de reconfig de gentoo :(


Les specs:

Intel celeron 400 mhz
Gentoo 2005.1
HD de 20go (messemble)
128mo mémoire (messemble)

Linux anakin 2.6.11-gentoo-r3 #1 SMP Wed Jun 1 09:56:49 EST 2005 i686
Celeron (Mendocino) GenuineIntel GNU/Linux
 
Re: question pour les plus forts (que moi) en linux parmi vous
  • Canada
  • Windows
  • Mozilla Thunderbird
Eric Maziade wrote:


> Dans le cas-où je finis par acheter un nouveau HD, je peux clôner le HD
> courant? J'ai pas envie de me taper une journée de reconfig de gentoo :(


Tu peux utiliser la commande dd (copy binaire hw-level) pour faire une copie exact de ton
hd. Par contre, si tu as des problèmes hw
avec ton hd, ou peut-être ton controlleur sur le hd, cette commande pourrait corrompre la
copie.

Personnellement, si j'avais à faire la copie d'un disque à un autre, j'utiliserais un
livecd comme knoppix pour exécuter la commande.

Si tu as la source (in file) sur /dev/hda1 et la destination (out file) sur /dev/hdb1 et
que tu as + de 256MB de RAM, alors la
commande serait
dd if=/dev/hda1 of=/dev/hdb1 bs=256M

Le bs permet d'utiliser un buffer RAM de 256MB lors de la copie, je pense que ça devrait
rendre l'opération plus rapide mais je ne
suis pas sûr à 100%.

Description de la commande:
http://www.die.net/doc/linux/man/man1/dd.1.html

Ciao,

--
Stefan Michalowski
Email: mitch(à)ptaff.ca
PGP Key: http://screamerone.zapto.org/k.asc
 
Re: question pour les plus forts (que moi) en linux parmi vous
  • Canada
  • GNU/Linux
  • Mutt
  • FOAF
  • PGP

> Tu peux utiliser la commande dd (copy binaire hw-level) pour faire une copie
> exact de ton hd. Par contre, si tu as des problèmes hw avec ton hd, ou
> peut-être ton controlleur sur le hd, cette commande pourrait corrompre la
> copie.


Pas recommandé sauf pour deux partitions d'exactement la même taille (rare), et
même là, pas vraiment une bonne idée je trouve. J'irais personnellement avec
un langoureux rsync, ainsi en cas d'erreurs sur certains fichiers on sait
lesquels sont mauvais. De plus, on évite de recopier de mauvais superblock.
Boni, on peut passer de ext3 à un filesystem performant :)

J'ai déjà migré de disque ainsi, alors je sais que ça fonctionne.
1) Partitionner;
2) Démarrer avec knoppix et copier les fichiers;
3) LILO!

Aucun problème. En boni, défragmentation.

ATTENTION:
---------
Si on veut garder les xattr et les acl, faut utiliser une version patchée de
rsync. Faut vérifier si ces features sont utilisés (c'est pas très populaire
alors si pas certain, probablement que non).




--
--====|====--
--------================|================--------
Patrice Levesque
http://ptaff.ca/
wayne(à)ptaff.ca
--------================|================--------
--====|====--
--
Pièces jointes
 

 

Propulsé par xhtmail