《GPU高性能计算之CUDA》实例

时间:2012-11-08 11:31:42
【文件属性】:
文件名称:《GPU高性能计算之CUDA》实例
文件大小:10.5MB
文件格式:RAR
更新时间:2012-11-08 11:31:42
GPU 高性能计算 CUDA 实例 《GPU高性能计算之CUDA》实例。 GPU高性能计算系列丛书的第一本《GPU高性能计算之CUDA》已经出版,由张舒,褚艳利,赵开勇,张钰勃所编写。本书除了详细介绍了CUDA的软硬件架构以及C for CUDA程序开发和优化的策略外,还包含有大量的实例供读者学习参考用。 下表是各个实例的介绍列表。 文件夹 对应书中章节 备注 ACsearch_DPPcompact_with_driver 5.2.2 AC多模式匹配算法 asyncAPI 2.5 异步API调用示例 bandwidthTest 2.3.6 带宽测试 Bitonic 5.1.1 双调排序网络 conjugateGradient 5.2.1 共轭梯度算法,CUBLAS实现 cudaMPI 2.7.3 CUDA+MPI管理GPU集群 cudaOpenMP 2.7.2 CUDA+OpenMP管理多GPU deviceQuery 2.1.4 设备查询 histKernel 2.4.3 亮度直方图统计 matrixAssign 2.1.4 矩阵赋值 matrixMul 4.7.1 矩阵乘法,利用shared memory matrixMul_Berkeley 4.7.1 矩阵乘法,利用register reduction 4.7.2 并行归约(缩减)程序 scan 5.1.2 Scan算法,例如计算前缀和 scanLargeArray 5.1.2 Scan算法,可以处理大数组 simpleCUBLAS 5.1.3 CUBLAS库的简单应用 simpleCUFFT 5.1.4 CUFFT库的简单应用 simpleD3D9 2.6.2 CUDA与Direct3D 9互操作 simpleD3D10 2.6.2 CUDA与Direct3D10互操作 simpleGL 2.6.1 CUDA与OpenGL互操作 simpleMultiGPU 2.7.1 多设备控制 simpleStreams 2.5.2 流的使用演示 simpleTexture 2.3.8 简单的纹理使用 simpleTextureDrv 2.3.8 简单的纹理使用,驱动API 实现 sortingNetworks 5.1.1 双调排序网络,处理大数组 threadMigration 2.7.1 通过上下文管理和设备管理功能实现多设备并行计算 timing 4.2.1 设备端测时 transpose 4.7.3 矩阵转置 transposeDiagonal 4.7.3 矩阵转置,考虑partition conflict VectorAdd 2.2.3/2.3.4 矢量加 VectorAddDrv 2.2.3/2.3.4 矢量加,驱动API实现 【备注】以上工程,均在Windows XP 64-bit + Tesla C1060 + CUDA 2.3 + VS2005环境下测试通过。
【文件预览】:
《GPU高性能计算之CUDA》实例
----matrixAssign.zip(12KB)
----reduction.zip(7.32MB)
----matrixMul_Berkeley.zip(7KB)
----timing.zip(9KB)
----VectorAddDrv.zip(9KB)
----asyncAPI.zip(6KB)
----simpleTexture.zip(638KB)
----scanLargeArray.zip(12KB)
----scan.zip(528KB)
----Bitonic.zip(10KB)
----simpleD3D10.zip(95KB)
----simpleStreams.zip(8KB)
----simpleCUFFT.zip(7KB)
----simpleTextureDrv.zip(649KB)
----cudaMPI.zip(211KB)
----GPU高性能计算之CUDA_书中实例_All.rar(4.67MB)
----threadMigration.zip(9KB)
----histKernel.zip(11KB)
----cudaOpenMP.zip(7KB)
----simpleD3D9.zip(357KB)
----simpleCUBLAS.zip(7KB)
----simpleMultiGPU.zip(9KB)
----simpleGL.zip(289KB)
----sortingNetworks.zip(15KB)
----bandwidthTest.zip(8KB)
----matrixMul.zip(11KB)
----ACsearch_DPPcompact_with_driver.zip(2.5MB)
----transpose.zip(10KB)
----deviceQuery.zip(6KB)
----VectorAdd.zip(8KB)
----transposeDiagonal.zip(9KB)

网友评论

  • 非常好,可以和书一起看。但是CUDA只能用在N卡上,A卡不能用……
  • 还行吧 入门级的
  • 正在研究GPU高性能计算,参考参考
  • 好多啊,应该很实用
  • 非常不错,学习了
  • 不错 挺好的,嘿嘿,正在学习中
  • 下载了,但没有用, 因为没有gpu
  • 内容比较丰富, 学习还得努力
  • 没怎么看,转去学习opengl了
  • 我感觉非常好,有很多例子,,对我非常有帮助,非常感谢楼主。
  • 比较实用,配合例子起来看很有收获
  • 不错,适合入门
  • 例子都很不错,不过有些失落,以为有文档了!
  • 好的资源,与代码例子,比较直观,很感谢分享
  • 全是实例没有别的,怎么用实例啊
  • 不错,刚好有我能用到的
  • 蛮久以前下的了,例子很多,学起来还是贵在坚持
  • 很详实的资料 结合书来看很有帮助 多谢分享
  • 不错的资料,对我还是有不少帮助的,也有例子,谢楼主了
  • 很好的资源,与代码例子,比较直观,很感谢分享。。。
  • 全是例子,貌似有sdk的例子。
  • 是代码,还是有帮助的
  • 基本是SDK里的程序和文档,
  • 全是例子,不错
  • 书本实例,因为手头上没有书,所以只能靠这个了 应该说还是不错的资源
  • 共31个程序,还没一一打开看,很全的实例,帮助很大
  • 谢谢楼主分享哟,很全的代码。
  • 代码非常全,例子不错,就是讲解相对少了点,总体还是很好的
  • 很全,但是第一个例子就运行不了,书编得太垃圾
  • 很全的代码...