文件名称:计算机结构并行化程序的替代方法的研究.pdf
文件大小:2.51MB
文件格式:PDF
更新时间:2022-08-12 11:52:36
嵌入式系统
本文提出了一种并行化程序的替代方法,比实际操作系统的基于API的方法(如OpenMP和MPI)更适合于多核处理器。该方法依赖于并行化硬件和适应的编程风格。它释放并捕获了构造级并行(ILP)。提出了一种多核设计,其中核是多线程的,并且能够分叉新线程。编程风格基于功能。硬件在每个函数调用时创建一个并发线程。编程风格和硬件创造了释放ILP的条件,通过消除calland之间的体系结构依赖性以及返回后的延续。我们说明了总和减少,矩阵乘法和排序的方法。我们测量并行运行的ILP,并表明它足够高,可以提供数千个内核,因为它随数据大小而增加。我们将我们的方法与pthread par allelization进行比较,表明(1)我们的并行执行是确定性的,(2)我们的线程管理缺陷,(3)我们的并行性是隐式的,(4)我们的方法并行化函数和循环。隐式并行性使并行代码易于编写和读取。确定性并行执行使并行代码易于调试