2、在不做任何優化的情況下(O0),啓用OpenMP並行代碼效率維持倍率線形提升,沒有問題。
3、在啓用最快優化的情況下(O3),單一線程下的執行效率明顯高於OpenMP並行執行效率,也就是說O3對單線程的提升作用遠比多線程明顯。
注:GCC 4.2的O3是很強大的,單線程情況下的一個算例從38秒左右提高到0.000076秒。貌似比Intel的編譯器強悍。。。。。但2線程同一個算例最快只能優化到0.000135秒左右。也就是說開啓O3,則很可能單線程執行速度會快過並行(只測試過2線程,高於2線程的情況沒有測過)。
結論:GCC 4.2 - 很強悍!但需要更強悍一些,尤其在對OpenMP多線程的優化上。西紅柿接受完畢!謝謝!

[ 本帖最后由 青蛙中的青蛙 于 2008-7-16 12:36 编辑 ]
| 更多同济资讯请访问同济大学论坛 | 直接去论坛查看 举报不良信息 广告投放联系 |
最新回复
青蛙中的青蛙 (2008-7-16 12:22:44)
aprilchu43 (2008-7-16 15:23:25)
这是什么字?请用简体中文翻译一遍
青蛙中的青蛙 (2008-7-16 16:29:44)