vine-users ML アーカイブ



[vine-users:059043] Re: クラスタ内の名前のリス トを得るには

  • From: Satoshi I.Nozawa <snozawa@xxxxxxxxxxxxxxxxxxxxx>
  • Subject: [vine-users:059043] Re: クラスタ内の名前のリス トを得るには
  • Date: Wed, 19 Mar 2003 11:04:40 +0900 (JST)
のざわです。かわむらさんのことで足りると思いますが、確認です。

>  独立したふたつのクラスタがあって、それぞれにおいてDHCP, NIC, MPI関係の
> (並列計算用の)サービスが動くホストが一台ずつあるとします。それぞれのク
> ラスタ内では複数の端末(ノード)がHUBを介してつながっています。

これは別のネットワークですよね。それとも同一のネットワークで、別のクラ
スター群が二つあって、動的にお互いの数が変るというのを想定しているので
しょうか。たぶん後者だと思いますが、もし前者であれば、

> クラスタAからノードをひとつ外してクラスタBに接続した場合、DHCPとNISを組

は、物理的にネットワークの継ぎ換えが必要だと思います。人手の介在と。

> うか(たとえばノードがひとつ消えることになるクラスタAにトラブルは起きな
> いでしょうか)?ということです。

どういうトラブルを想定していますか。普通に Windows の電源を落すという
ことだと思ってよいのではないでしょうか。

それから、上に書いた後者であれば、特に別々なクラスター群にわける必要は
ないと思います。動的に切離し接続を考えているならば、ノードに性能差はな
いと思いますが、確認です。というのも、別々のクラスター群で、ユーザーの
制限をして、サービスの質を変えようとしているのでしょうか。

というのも、かわむらさんが書かれているように、DHCP,NIS,NFS のサーバー
(サービスが動くホスト)を一緒にした方が良いと思います。

ただし、ユーザーを別々なものにして、使用者が多い方に CPU をたくさん割
当てるということを想定しているのでしょうか。ならばもっと違う角度、たと
えばスーパーコンピューターが CPU を提供するときに使う QUEUE の考え方、
NQS 等で CPU の数を最初から決めて、サービスの質をユーザー毎に変えて提
供するというものもあります。

> す。たとえば自分の環境では、ファイル名をlamhostsとしてその中に

LAM/MPI ですね。再コンパイルせずに動的に CPU 数を得てから、割り振りを
決めるというプログラムの開発を私はしたことがないので、純粋にうらやまし
いです。これについてはかわむらさんが書かれたように rwhod で対応したら
よいでしょう。MPICH でも -p4pg の mpifile に、そのように書くようなスク
リプトを書けば済むように思えます。

>  付け足しですが、DHCP, NFS, NIS, MPIといったサービスを一台で兼ねるケー
> スに大きな問題はないでしょうか。あくまでテスト計算用のクラスタについての

問題はないと思います。私は同一のネットワークで NIS,NFS,DHCP,diskless
でクラスター群を二つ(6x2+7)で組んでいますが、ほとんど問題ありません。

それより、普通に 20 台組んで計算すると、並列度自体が低くなってしまいま
す。GbitEther なり Myrinet なり、Score なりでトータルで性能を上げてい
く必要もあり、また自分が使う並列化プログラム自体のチューンも必要がある
と痛感しています。