《大规模并行处理器程序设计(英文版原书第3版)/经典原版书库》(美)大卫·B.柯克//胡文美机械工业出版社PDF电子书网盘迅雷下载、免费在线阅读-兰台网

大卫·B. 柯克（David B. Kirk）美国国家工程院院士，NVIDIA Fellow，曾任NVIDIA公司首席科学家。他领导了NVIDIA图形技术的开发，并且是CUDA技术的创始人之一。2002年，他荣获ACM SIGGRAPH计算机图形成就奖，以表彰其在把高性能计算机图形系统推向大众市场方面做出的杰出贡献。他拥有加州理工学院计算机科学博士学位。胡文美（Wen-mei W. Hwu）美国伊利诺伊大学厄巴纳-香槟分校电气与计算机工程系AMD Jerry Sanders讲席教授，并行计算研究中心首席科学家，领导IMPACT团队和CUDA很好中心的研究工作。他在编译器设计、计算机体系结构、微体系结构和并行计算方面做出了很好贡献，是IEEE Fellow、ACM Fellow，荣获了包括ACM SigArch Maurice Wilkes Award在内的众多奖项。他还是MulticoreWare公司的联合创始人兼CTO。他拥有加州大学伯克利分校计算机科学博士学位。

Preface Acknowledgements CHAPTER.1 Introduction.................................................................................1 1.1 Heterogeneous Parallel Computing................................................2 1.2 Architecture of a Modern GPU.......................................................6 1.3 Why More Speed or Parallelism?...................................................8 1.4 Speeding Up Real Applications....................................................10 1.5 Challenges in Parallel Programming ............................................12 1.6 Parallel Programming Languages and Models.............................12 1.7 Overarching Goals........................................................................14 1.8 Organization of the Book..............................................................15 References ............................................................................................18 CHAPTER.2 Data Parallel Computing.......................................................19 2.1 Data Parallelism............................................................................20 2.2 CUDA C Program Structure.........................................................22 2.3 A Vector Addition Kernel .............................................................25 2.4 Device Global Memory and Data Transfer...................................27 2.5 Kernel Functions and Threading...................................................32 2.6 Kernel Launch...............................................................................37 2.7 Summary.......................................................................................38 Function Declarations...................................................................38 Kernel Launch...............................................................................38 Built-in (Predefined) Variables .....................................................39 Run-time API................................................................................39 2.8 Exercises.......................................................................................39 References ............................................................................................41 CHAPTER.3 Scalable Parallel Execution................................................43 3.1 CUDA Thread Organization.........................................................43 3.2 Mapping Threads to Multidimensional Data................................47 3.3 Image Blur: A More Complex Kernel ..........................................54 3.4 Synchronization and Transparent Scalability ...............................58 3.5 Resource Assignment....................................................................60 3.6 Querying Device Properties..........................................................61 3.7 Thread Scheduling and Latency Tolerance...................................64 3.8 Summary.......................................................................................67 3.9 Exercises.......................................................................................67 CHAPTER.4 Memory and Data Locality ...................................................71 4.1 Importance of Memory Access Efficiency....................................72 4.2 Matrix Multiplication....................................................................73 4.3 CUDA Memory Types..................................................................77 4.4 Tiling for Reduced Memory Traffic..............................................84 4.5 A Tiled Matrix Multiplication Kernel...........................................90 4.6 Boundary Checks..........................................................................94 4.7 Memory as a Limiting Factor to Parallelism................................97 4.8 Summary.......................................................................................99 4.9 Exercises...........................................

图书	大规模并行处理器程序设计(英文版原书第3版)/经典原版书库
内容	内容推荐本书介绍并行编程和GPU架构的基本概念，详细探索了构建并行程序的各种技术，涵盖性能、浮点格式、并行模式和动态并行等主题，适合专业人士及学生阅读。书中通过案例研究展示了开发过程，从计算思维的细节着手，*终给出了高效的并行程序示例。新版更新了关于CUDA的讨论，包含CuDNN等新的库，同时将不再重要的内容移到附录中。新版还增加了关于并行模式的两个新章节，并更新了案例研究，以反映当前的行业实践。作者简介大卫·B. 柯克（David B. Kirk）美国国家工程院院士，NVIDIA Fellow，曾任NVIDIA公司首席科学家。他领导了NVIDIA图形技术的开发，并且是CUDA技术的创始人之一。2002年，他荣获ACM SIGGRAPH计算机图形成就奖，以表彰其在把高性能计算机图形系统推向大众市场方面做出的杰出贡献。他拥有加州理工学院计算机科学博士学位。胡文美（Wen-mei W. Hwu）美国伊利诺伊大学厄巴纳-香槟分校电气与计算机工程系AMD Jerry Sanders讲席教授，并行计算研究中心首席科学家，领导IMPACT团队和CUDA很好中心的研究工作。他在编译器设计、计算机体系结构、微体系结构和并行计算方面做出了很好贡献，是IEEE Fellow、ACM Fellow，荣获了包括ACM SigArch Maurice Wilkes Award在内的众多奖项。他还是MulticoreWare公司的联合创始人兼CTO。他拥有加州大学伯克利分校计算机科学博士学位。目录 Preface Acknowledgements CHAPTER.1 Introduction.................................................................................1 1.1 Heterogeneous Parallel Computing................................................2 1.2 Architecture of a Modern GPU.......................................................6 1.3 Why More Speed or Parallelism?...................................................8 1.4 Speeding Up Real Applications....................................................10 1.5 Challenges in Parallel Programming ............................................12 1.6 Parallel Programming Languages and Models.............................12 1.7 Overarching Goals........................................................................14 1.8 Organization of the Book..............................................................15 References ............................................................................................18 CHAPTER.2 Data Parallel Computing.......................................................19 2.1 Data Parallelism............................................................................20 2.2 CUDA C Program Structure.........................................................22 2.3 A Vector Addition Kernel .............................................................25 2.4 Device Global Memory and Data Transfer...................................27 2.5 Kernel Functions and Threading...................................................32 2.6 Kernel Launch...............................................................................37 2.7 Summary.......................................................................................38 Function Declarations...................................................................38 Kernel Launch...............................................................................38 Built-in (Predefined) Variables .....................................................39 Run-time API................................................................................39 2.8 Exercises.......................................................................................39 References ............................................................................................41 CHAPTER.3 Scalable Parallel Execution................................................43 3.1 CUDA Thread Organization.........................................................43 3.2 Mapping Threads to Multidimensional Data................................47 3.3 Image Blur: A More Complex Kernel ..........................................54 3.4 Synchronization and Transparent Scalability ...............................58 3.5 Resource Assignment....................................................................60 3.6 Querying Device Properties..........................................................61 3.7 Thread Scheduling and Latency Tolerance...................................64 3.8 Summary.......................................................................................67 3.9 Exercises.......................................................................................67 CHAPTER.4 Memory and Data Locality ...................................................71 4.1 Importance of Memory Access Efficiency....................................72 4.2 Matrix Multiplication....................................................................73 4.3 CUDA Memory Types..................................................................77 4.4 Tiling for Reduced Memory Traffic..............................................84 4.5 A Tiled Matrix Multiplication Kernel...........................................90 4.6 Boundary Checks..........................................................................94 4.7 Memory as a Limiting Factor to Parallelism................................97 4.8 Summary.......................................................................................99 4.9 Exercises...........................................
标签
缩略图
书名	大规模并行处理器程序设计(英文版原书第3版)/经典原版书库
副书名
原作名
作者	(美)大卫·B.柯克//胡文美
译者
编者
绘者
出版社	机械工业出版社
商品编码（ISBN）	9787111668367
开本	16开
页数	550
版次	1
装订	平装
字数
出版时间	2021-01-01
首版时间	2021-01-01
印刷时间	2021-01-01
正文语种	英
读者对象
适用范围
发行范围	公开发行
发行模式	实体书
首发网站
连载网址
图书大类
图书小类
重量	936
CIP核字	2020207752
中图分类号	TP311.11
丛书名
印张	35.5
印次	1
出版地	北京
长
宽
高
整理
媒质
用纸
是否注音
影印版本
出版商国别
是否套装
著作权合同登记号
版权提供者
定价
印数
出品方
作品荣誉
主角
配角
其他角色
一句话简介
立意
作品视角
所属系列
文章进度
内容简介
作者简介
目录
文摘
安全警示	适度休息有益身心健康，请勿长期沉迷于阅读小说。
随便看	女儿你一定要学会保护自己(插图版) 家庭农场金融支持一生感动(日本匠人精神与家训) 骑云而来的鹰/男孩阿墨系列力量训练解剖全书激光清洗技术与应用(精)/变革性光科学与技术丛书高危重症产科学(原书第4版国际经典产科学译著)(精) 日知录/中华传统文化百部经典陈友谅传美国黄石国家公园生态管理的历史考察(1872-1995) 设计风格图解/设计之本商业新变革与城市商业空间研究小博士学人工智能与编程环保运动先锋(蕾切尔·卡逊)/杰出女科学家汤液经临证五十年(伤寒温病手足六经辨证)/中医师承学堂德润民心(宁波邵家丘村发展研究)/中国村庄发展浙江样本研究丛书多特征分水岭影像分割斜坡地质灾害提取电影市场扩散的原理与实证/中国电影学派研究丛书简·爱(升级版)/世界少年文学经典文库百姓历史名人楹联集(精) 河北省西部贫困山区科技引领现代农业产业发展研究及推广应用--以阜平县为例大熊柚子和小熊芒果/彩虹桥中国名家原创桥梁书中文分级阅读(9年级共12册) 基于资源流-价值流的我国铁路会计信息质量优化研究/轨道交通特色经济管理论丛小屁孩日记(2年级趣事多2注音全彩美绘)/校园故事大王黄宇小屁孩书系雨林木风 WinXP SP3 安装版 YS8.0 迅雷 Google Picasa 3 picasa网络相册 V3.9.0 Build(141.259) 谷歌图像浏览器官方安装版文件管理专家文管王 V8.21 中文官方安装版 GPL Ghostscript 图像浏览插件 v9.19 英文免费安装版 A-PDF Word to PDF 文档格式转换器 v5.7.0 英文安装版 Total Uninstall(监视软件安装的所有过程) v7.00 完美注册中文免费版 360健康精灵独立版 v1.0.0.1013 绿色中文免费版 Super File Shredder(文件粉碎机) v4.12 汉化单文件版 QQ音乐2012(老版本) V8.4 中文绿色免费版安国AlcorMP 量产工具合集(附pdf教程) 铁甲战队极限盘带 Oh My Cat 猫爪邪恶疯人院我要开飞机球球弹一弹我的无间道闯关杀2 天天挂机修仙时间感知训练器共饮一江水万渣朝凰之风华名媛独女君未见第一季我爱北京天安门大考白日梦我无间行者金田一少年事件簿金田一少年の事件簿杠杆大运河