Una de les coses que, de bones a primeres, em va sobtar en començar la feina a aquí Estocolm va ser que el cluster del grup no té sistema de cues. Ni límits de càlculs ni res. Simplement quan comences et diuen que no abusis i llestos!

Per als “no iniciats”, un sistema de cues és un sistema que controla la feina en un cluster (grup d’ordinadors). És a dir, podem tenir 100 màquines però per calcular no ens connectem una a una, ens connectem a la que gestiona i li donem l’ordre. Si hi ha màquines lliures, la que gestiona els passa la feina. Si no hi ha màquines disponibles, posa la teva feina en una cua. Això a la vegada es pot emprar per limitar coses com ara la quantitat de màquines que pot emprar un usuari, el temps que poden trigar els teus treballs,…

Doncs bé, el grup en el que treballo no té sistema de cues. La manera de funcionar però no és massa complicada, ens connectem a una màquina i des d’allà s’executa un script que t’indica l’estat de les màquines. Si en veus una de lliure, t’hi connectes i dones la teva ordre. A nivell de control el tema funciona “per confiança”, és a dir, no hi ha límit concret, simplement has de vigilar no passar-te.

El sistema té coses bones i coses dolentes. Com a dolent té, per mi és el més important, que en un sistema de cues, si tinc un límit per exemple de 15 màquines però he de fer 30 tasques, el gestor s’encarregarà que mai tingui més de 15 màquines ocupades. En canvi, si no hi ha gestor i no puc abusar, he d’anar enviant els càlculs amb més control.

Com a coses bones, s’aprofiten molt les màquines i si et cal fer molta cosa de cop, pots. És a dir, si hi ha poca cosa executant-se i jo tinc molta feina doncs, sempre respectant el “no abusar”, doncs, dóno moltes més ordres. Això amb un sistema de cues també es pot fer, li demanes l’administrador que et dóni més permisos i llestos. Però… éssent realista, aquestes coses sempre porten polèmica i no es fan.

Doncs, aquí em teniu, calculant “anàrquicament” :-)

Però… voldria afegir que això depèn molt dels recursos de que es disposa. Aquí tenim 70 màquines duals (140 processadors) per 9 persones,… processadors/usuaris=15.5. A Tarragona, i crec que tenim un bon clúster, la proporció es redueix a 8 (i crec que és més baixa ja que som “generosos” i hi ha gent de fora que també les usa).