加治/日誌/2011-10-07
をテンプレートにして作成
[
トップ
] [
新規
|
一覧
|
単語検索
|
最終更新
|
ヘルプ
|
ログイン
]
開始行:
[[加治/日誌]]
*本日 [#j1169d98]
-自力でやりたい
*今日やったこといろいろ [#e9e75bc7]
**ありすぎてわすれた [#aee27d6c]
**MPIが動かねぇ [#iccde362]
-コンパイルは通るが実行して実際に計算するところでエラー
-Ubuntu環境では実行出来るものをコピーしてみても動かない
--diffかけて見たところソースは同じだった。
---ソースの問題ではない?環境依存?
-MPIの環境がzxg001&002とzxg003&004とでは違うようだ
--なぜかzxg003にはMPI実行環境が入ってなかった
--だが同じOpenMPIのようだ
---makeとかでインスコしたものとyumでインスコしたもので違うとか?知らん
---どちらにしろ一貫しないとそういうようなエラーが出る。
---例えばこっちのホストではこのパスをつかってこっちのホストではこっちのパスつかうとか
--yumで統一する。zxg001,002のOpenMPI環境を削除してyumで入れることにする
---# yum install openmpi
---しかし依存関係でエラー。さらにInfinibandの動作にも影響してくるようでごちゃごちゃに
--zxg004の環境をddコマンドですべてのホストにコピーしてホスト名を変更することにした
-ちなみにzxg004の環境でもhello, worldは動くが森田さんのプログラムは動かない。
--ノードは自分だけにも関わらず。
***ごちゃごちゃになったのでDDで全てのノードをzxg004と同じ状態にする [#y33ccc5e]
-ホスト名は変更。
-ddは''アンマウントしてから''
-それでもエラー。
--エラー内容
[zxg001.u-aizu.ac.jp:4627] *** An error occurred in MPI_Send
[zxg001.u-aizu.ac.jp:4627] *** on communicator MPI_COMM_WORLD
[zxg001.u-aizu.ac.jp:4627] *** MPI_ERR_RANK: invalid rank
[zxg001.u-aizu.ac.jp:4627] *** MPI_ERRORS_ARE_FATAL (your MPI job will now abort)
[zxg001.u-aizu.ac.jp:04623] [[24191,0],0]-[[24191,1],0] mca_oob_tcp_msg_recv: readv failed: Connection reset by peer (104)
--------------------------------------------------------------------------
mpirun has exited due to process rank 0 with PID 4627 on
node zxg001.u-aizu.ac.jp exiting without calling "finalize". This may
have caused other processes in the application to be
terminated by signals sent by mpirun (as reported here).
--------------------------------------------------------------------------
--こんなのを発見
In this case, the error MPI_ERR_RANK: invalid rank resulted
because the program called MPI_Send with a destination rank that
was outside the allowed range.
---http://www.cb.uu.se/~cris/ParallelImageAnalysis/mpi_lecture_slides.pdf
---ランクが範囲外?どういうことだ
---MPI_Sendのdestinationはちゃんとintだぞ
終了行:
[[加治/日誌]]
*本日 [#j1169d98]
-自力でやりたい
*今日やったこといろいろ [#e9e75bc7]
**ありすぎてわすれた [#aee27d6c]
**MPIが動かねぇ [#iccde362]
-コンパイルは通るが実行して実際に計算するところでエラー
-Ubuntu環境では実行出来るものをコピーしてみても動かない
--diffかけて見たところソースは同じだった。
---ソースの問題ではない?環境依存?
-MPIの環境がzxg001&002とzxg003&004とでは違うようだ
--なぜかzxg003にはMPI実行環境が入ってなかった
--だが同じOpenMPIのようだ
---makeとかでインスコしたものとyumでインスコしたもので違うとか?知らん
---どちらにしろ一貫しないとそういうようなエラーが出る。
---例えばこっちのホストではこのパスをつかってこっちのホストではこっちのパスつかうとか
--yumで統一する。zxg001,002のOpenMPI環境を削除してyumで入れることにする
---# yum install openmpi
---しかし依存関係でエラー。さらにInfinibandの動作にも影響してくるようでごちゃごちゃに
--zxg004の環境をddコマンドですべてのホストにコピーしてホスト名を変更することにした
-ちなみにzxg004の環境でもhello, worldは動くが森田さんのプログラムは動かない。
--ノードは自分だけにも関わらず。
***ごちゃごちゃになったのでDDで全てのノードをzxg004と同じ状態にする [#y33ccc5e]
-ホスト名は変更。
-ddは''アンマウントしてから''
-それでもエラー。
--エラー内容
[zxg001.u-aizu.ac.jp:4627] *** An error occurred in MPI_Send
[zxg001.u-aizu.ac.jp:4627] *** on communicator MPI_COMM_WORLD
[zxg001.u-aizu.ac.jp:4627] *** MPI_ERR_RANK: invalid rank
[zxg001.u-aizu.ac.jp:4627] *** MPI_ERRORS_ARE_FATAL (your MPI job will now abort)
[zxg001.u-aizu.ac.jp:04623] [[24191,0],0]-[[24191,1],0] mca_oob_tcp_msg_recv: readv failed: Connection reset by peer (104)
--------------------------------------------------------------------------
mpirun has exited due to process rank 0 with PID 4627 on
node zxg001.u-aizu.ac.jp exiting without calling "finalize". This may
have caused other processes in the application to be
terminated by signals sent by mpirun (as reported here).
--------------------------------------------------------------------------
--こんなのを発見
In this case, the error MPI_ERR_RANK: invalid rank resulted
because the program called MPI_Send with a destination rank that
was outside the allowed range.
---http://www.cb.uu.se/~cris/ParallelImageAnalysis/mpi_lecture_slides.pdf
---ランクが範囲外?どういうことだ
---MPI_Sendのdestinationはちゃんとintだぞ
ページ名: