Jeudi 28 Février 2019

Cher Journal,

Une nouvelle absence de quelque jours se prépare, mais des jobs de l'office météorologique de Royaume-Uni viennent de tomber dans BOINC. Ces jobs proviennent du projet climateprediction.net.

Ces jobs ont cependant un défaut : celui de ne pas aimer être interrompus. Or, un client BOINC, pour tout un tas de bonnes raisons, va pouvoir interrompre les calculs en cours d'exécution. Les Bayliss explique sur le forum de climateprediction.net comment calibrer la configuration du client BOINC pour les jobs de l'office météo. Merci à Les Bayliss de m'avoir indiqué ce truc, au passage. :^)

Pour faire court :

  1. les jobs doivent rester en mémoire le temps de l'interruption, de cette façon, seul un SIGSTOP est envoyé, et la tâche peut reprendre au SIGCONT suivant sans perdre les données de calcul qui n'ont pas été sauvegardée depuis le dernier checkpoint ;
  2. si la charge CPU extérieure à BOINC dépasse un certain seuil, éviter de stopper les jobs BOINC en cours d'exécution reste préférable ;
  3. éviter de limiter le temps CPU des jobs reste préférable, car cette limitation est implémentée en envoyant continuellement des signaux d'arrêt et de reprise au processus en cours d'exécution.

Afin de garder un œil à distance sur la machine, un petit outil très bête de monitoring vient tout juste de naître. La commande n'est pas très alléchante, et se nomme bêtement html-machine-status. Pour l'utiliser, la première étape consiste à se positionner dans le répertoire où publier le rapport de monitoring. La seconde étape consiste à produire les fichiers HEADER.html et README.html, affichant respectivement le contenu des observables, et la date du dernier rapport. Sur le même principe que mon réveil matin, l'exécution régulière de ce programme de monitoring est gérée par cron.

[ICO]NameLast modifiedSize
[PARENTDIR]Parent Directory  -
[DIR]monitor-test/2019-02-28 22:31 -
[TXT]html-machine-status.sh2019-02-28 23:08 1.9K

  —