avatar
问个MPI问题(有包子)# Computation - 科学计算
s*s
1
有意义的回答,包子一个. Many thanks
解决问题的回答: 包子n个
可能是什么样的bug导致如下的错误信息
程序出错,
p4_error: latest msg from perror: Invalid argument
p0_10958: p4_error: OOPS: semop lock failed: -1
Killed by signal 2.
p0_10958: (782.811527) net_send: could not write to fd=4, errno = 32
Killed by signal 2.
Killed by signal 2.
最后track 到这一句:
(rank 0 ): MPI_Recv( data_need_sent, 11 , MPI_INT, MPI_ANY_SOURCE, MPI_ANY_
TAG, MPI_COMM_WORLD, &status);
这个语句执行过多次,最后才崩溃.
发送在这儿:
(rank i( i != 0 ) ): MPI_Send ( data_need_sent, 11, MPI_INT,
avatar
s*s
2
今天才解决。程序有逻辑错误,导致
MPI_Send, MPI_Recv 反复执行。
当执行过n 次后,MPICH崩溃了。
但是,如果使用MPICH2,程序是不会崩溃的,只是
一直执行,程序不会结束而已。
看来还是用MPICH2的好。
谢谢大家~

【在 s*s 的大作中提到】
: 有意义的回答,包子一个. Many thanks
: 解决问题的回答: 包子n个
: 可能是什么样的bug导致如下的错误信息
: 程序出错,
: p4_error: latest msg from perror: Invalid argument
: p0_10958: p4_error: OOPS: semop lock failed: -1
: Killed by signal 2.
: p0_10958: (782.811527) net_send: could not write to fd=4, errno = 32
: Killed by signal 2.
: Killed by signal 2.

相关阅读
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。