文件名称:论文研究-基于CUDA的高速FFT计算.pdf
文件大小:601KB
文件格式:PDF
更新时间:2022-08-11 14:16:34
图形处理器,通用并行计算架构,映射策略,存储层次
针对快速傅里叶算法FFT在图形图像处理和科学计算领域的重要作用,提出了一种基于CUDA的高速FFT计算方法,在分析GPU硬件平台执行模式及FFT算法并行性特征的基础上,采用多线程并行的映射方法实现算法,并从存储层次优化算法。实验结果表明该算法的高效性,优化后的FFT加速比能达到CUFFT库加速比的26倍。