s*s 发帖数: 100 | 1 有意义的回答,包子一个. Many thanks
解决问题的回答: 包子n个
可能是什么样的bug导致如下的错误信息
程序出错,
p4_error: latest msg from perror: Invalid argument
p0_10958: p4_error: OOPS: semop lock failed: -1
Killed by signal 2.
p0_10958: (782.811527) net_send: could not write to fd=4, errno = 32
Killed by signal 2.
Killed by signal 2.
最后track 到这一句:
(rank 0 ): MPI_Recv( data_need_sent, 11 , MPI_INT, MPI_ANY_SOURCE, MPI_ANY_
TAG, MPI_COMM_WORLD, &status);
这个语句执行过多次,最后才崩溃.
发送在这儿:
(rank i( i != 0 ) ): MPI_Send ( data_need_sent, 11, MPI_INT, | s*s 发帖数: 100 | 2 今天才解决。程序有逻辑错误,导致
MPI_Send, MPI_Recv 反复执行。
当执行过n 次后,MPICH崩溃了。
但是,如果使用MPICH2,程序是不会崩溃的,只是
一直执行,程序不会结束而已。
看来还是用MPICH2的好。
谢谢大家~
【在 s*s 的大作中提到】 : 有意义的回答,包子一个. Many thanks : 解决问题的回答: 包子n个 : 可能是什么样的bug导致如下的错误信息 : 程序出错, : p4_error: latest msg from perror: Invalid argument : p0_10958: p4_error: OOPS: semop lock failed: -1 : Killed by signal 2. : p0_10958: (782.811527) net_send: could not write to fd=4, errno = 32 : Killed by signal 2. : Killed by signal 2.
|
|