标准模式为:
第一步:打开并行池parpool
第二步:parfor等相关PCT,并行计算工具箱中函数
第三步:关闭并行池
第一步:打开并行池的方式:
1)p = parpool('local',2); % 在知道有几个本地核的情况下,选择调用几个核进行并行运算。
2)parpool; % 这是直接打开并行池的方式。
备注:建议采用第一种,方便关闭和更改参数。
第二步:parfor函数的问题:
1)很多简单的低纬度运算,建议只需要用普通函数和关键字即可,用parfor函数进行运算并不能提升性能。
2)MATLAB利用多核心的计算能力来加速计算时非常有必要的,因为目前所有的电脑最少都双核心了。
3)循环并行使用parfor循环代替for循环,但是很多时候parfor很不好用,当parfor循环体内的代码比较多时,非常不容易满足循环条件而失败。因此我们首先要分析代码,另一种方式用profiler打开代码分析器来分析代码那一部分耗时较大,进行代码分析。
3)通用格式:
parfor ss = 1:100
XXX
......
......
end
4)通用并行计算模板:其基本思路就是将循环体内代码打包为函数!
parfor ss=1:100
func(ss,...,...);
end
函数如下所示:
function func(ss,...,...)
xxx
.....
.....
end
备注:该函数不应该有返回值,当parfor循环体内计算结果需要返回主函数时(绝大多数情况是这样的),那么将结果在循环体内保存为文件,文件名与循环变量ss有关。当parfor的并行运行完之后,将保存的临时文件读取进来即可,保存和读取计算结果相比于大型的计算耗时来讲应该小很多,从而体现出并行的优势。所提供的该方法可以用于任何一维、二维或者多维循环的加速计算,采用这种方法,规避了学习parofr规则的所有难点,非常具有通用性。
第三步:删除并行池参数关闭
delete(p)
举个例子:比如有这么一段并行计算代码,其中绿色标注的位置为循环体。
1 2 3 4 5 6 7 8 | p = parpool( 'local' ,2);tic n = 200; A = 500; a = zeros(n); parfor i = 1:n a(i) = max(abs(eig(rand(A)))); end tocdelete(p) |
当然这个循环体内可以有不同的计算队列,我们把这个队列封装成为一个函数,如下:
1 2 3 | function [a] = sample(A) a = max(abs(eig(rand(A)))); end |
然后再用parpool调用,如下:
1 2 3 4 5 6 7 8 9 10 11 12 13 | p = parpool( 'local' ,2); clear; tic n = 200; A = 500; a = zeros(n); parfor i = 1:n b = sample(A); a(i) = b; end clear b; toc delete(p);时间已过 28.838599 秒。 |
对比原先的代码:
1 2 3 4 5 6 7 8 9 | tic n = 200; A = 500; a = zeros(n); for i = 1:n a(i) = max(abs(eig(rand(A)))); end toc 时间已过 42.570194 秒。 |
MATLAB并行计算的提升有限和MATLAB语言的效率有关,并且和处理的数据量和计算复杂度有关。