のざわです。かわむらさんのことで足りると思いますが、確認です。 > 独立したふたつのクラスタがあって、それぞれにおいてDHCP, NIC, MPI関係の > (並列計算用の)サービスが動くホストが一台ずつあるとします。それぞれのク > ラスタ内では複数の端末(ノード)がHUBを介してつながっています。 これは別のネットワークですよね。それとも同一のネットワークで、別のクラ スター群が二つあって、動的にお互いの数が変るというのを想定しているので しょうか。たぶん後者だと思いますが、もし前者であれば、 > クラスタAからノードをひとつ外してクラスタBに接続した場合、DHCPとNISを組 は、物理的にネットワークの継ぎ換えが必要だと思います。人手の介在と。 > うか(たとえばノードがひとつ消えることになるクラスタAにトラブルは起きな > いでしょうか)?ということです。 どういうトラブルを想定していますか。普通に Windows の電源を落すという ことだと思ってよいのではないでしょうか。 それから、上に書いた後者であれば、特に別々なクラスター群にわける必要は ないと思います。動的に切離し接続を考えているならば、ノードに性能差はな いと思いますが、確認です。というのも、別々のクラスター群で、ユーザーの 制限をして、サービスの質を変えようとしているのでしょうか。 というのも、かわむらさんが書かれているように、DHCP,NIS,NFS のサーバー (サービスが動くホスト)を一緒にした方が良いと思います。 ただし、ユーザーを別々なものにして、使用者が多い方に CPU をたくさん割 当てるということを想定しているのでしょうか。ならばもっと違う角度、たと えばスーパーコンピューターが CPU を提供するときに使う QUEUE の考え方、 NQS 等で CPU の数を最初から決めて、サービスの質をユーザー毎に変えて提 供するというものもあります。 > す。たとえば自分の環境では、ファイル名をlamhostsとしてその中に LAM/MPI ですね。再コンパイルせずに動的に CPU 数を得てから、割り振りを 決めるというプログラムの開発を私はしたことがないので、純粋にうらやまし いです。これについてはかわむらさんが書かれたように rwhod で対応したら よいでしょう。MPICH でも -p4pg の mpifile に、そのように書くようなスク リプトを書けば済むように思えます。 > 付け足しですが、DHCP, NFS, NIS, MPIといったサービスを一台で兼ねるケー > スに大きな問題はないでしょうか。あくまでテスト計算用のクラスタについての 問題はないと思います。私は同一のネットワークで NIS,NFS,DHCP,diskless でクラスター群を二つ(6x2+7)で組んでいますが、ほとんど問題ありません。 それより、普通に 20 台組んで計算すると、並列度自体が低くなってしまいま す。GbitEther なり Myrinet なり、Score なりでトータルで性能を上げてい く必要もあり、また自分が使う並列化プログラム自体のチューンも必要がある と痛感しています。