日韩偷拍一区二区,国产香蕉久久精品综合网,亚洲激情五月婷婷,欧美日韩国产不卡

在線客服
科學計算與企業級應用的并行優化圖書
人氣:50

科學計算與企業級應用的并行優化

T行業急需這本書 和本系列的前兩本書一樣,在解釋為什么筆者認為軟件工程師需要這本書之前,筆者先來介紹并行、并發和代碼性能優化這3個概念,因為理解這3個概念是閱讀本系列3本書的基礎。 并行對應的英文單詞是p...
  • 所屬分類:圖書 >計算機/網絡>企業軟件開發與實施  
  • 作者:[劉文志] 著
  • 產品參數:
  • 叢書名:高性能計算技術叢書
  • 國際刊號:9787111506287
  • 出版社:機械工業出版社
  • 出版時間:2015-07
  • 印刷時間:2015-07-01
  • 版次:1
  • 開本:16開
  • 頁數:--
  • 紙張:膠版紙
  • 包裝:平裝
  • 套裝:

內容簡介

本書系統、深入講解了科學計算及企業級應用的并行優化方法與實踐。第1章介紹了常見的并行編程基于的多核/眾核向量處理器架構。第2章介紹了如何在X86、ARM和GPU上優化常見的線性代數運算。第3章介紹了如何在X86和GPU處理器上優化偏微分方程的求解。第4章介紹了如何在X86處理器和GPU上優化常見的分子動力學算法。第5章詳細介紹了如何在X86、ARM和GPU上優化常見的機器學習算法。

目錄

第1章 多核向量處理器架構

1.1 眾核系統結構

1.2 眾核架構的一致性

1.3 多核向量處理器架構

1.3.1 Intel Haswell CPU架構

1.3.2 ARM A15多核向量處理器架構

1.3.3 AMD GCN GPU架構

1.3.4 NVIDIA Kepler和Maxwell GPU架構

1.4 Intel MIC架構

1.4.1 整體架構

1.4.2 計算單元

1.4.3 存儲器單元

1.4.4 MIC架構上一些容易成為瓶頸的設計

1.5 OpenCL程序在多核向量處理器上的映射

1.5.1 OpenCL程序在多核向量CPU上的映射

1.5.2 OpenCL程序在NVIDIA GPU上的映射

1.5.3 OpenCL程序在AMD GCN上的映射

1.6 OpenCL程序在各眾核硬件上執行的區別

1.7 眾核編程模式

1.8 眾核性能優化

1.9 MIC和GPU編程比較

1.10 本章小結

第2章 常見線性代數算法優化

2.1 稀疏矩陣與向量乘法

2.1.1 稀疏矩陣的存儲格式

2.1.2 CSR 格式稀疏矩陣與向量乘法

2.1.3 ELL格式稀疏矩陣與向量乘

2.2 對稱矩陣與向量乘積

2.2.1 串行代碼

2.2.2 向量化對稱矩陣與向量乘積

2.2.3 OpenMP 并行化

2.2.4 CUDA 代碼

2.3 三角線性方程組的解法

2.3.1 串行算法

2.3.2 串行算法優化

2.3.3 AVX 優化實現

2.3.4 NEON 優化實現

2.3.5 如何提高并行度

2.3.6 CUDA 算法實現

2.4 矩陣乘法

2.4.1 AVX指令計算矩陣乘法

2.4.2 NEON指令計算矩陣乘法

2.4.3 GPU計算矩陣乘法

2.5 本章小結

第3章 優化偏微分方程的數值解法

3.1 熱傳遞問題

3.1.1 C代碼及性能

3.1.2 OpenMP代碼及性能

3.1.3 OpenACC代碼及性能

3.1.4 CUDA代碼

3.2 簡單三維Stencil

3.2.1 串行實現

3.2.2 Stencil在X86處理器上實現的困境

3.2.3 CUDA實現

3.3 本章小結

第4章 優化分子動力學算法

4.1 簡單搜索的實現

4.1.1 串行代碼

4.1.2 向量化實現分析

4.1.3 OpenMP實現

4.1.4 CUDA實現

4.2 范德華力計算

4.2.1 串行實現

4.2.2 向量化實現分析

4.2.3 OpenMP實現

4.2.4 CUDA實現

4.2.5 如何提高緩存的利用

4.3 鍵長伸縮力計算

4.3.1 串行實現

4.3.2 向量化實現

4.3.3 OpenMP實現

4.3.4 CUDA實現

4.4 徑向分布函數計算

4.4.1 串行實現

4.4.2 向量化實現

4.4.3 OpenMP實現

4.4.4 CUDA實現

4.5 本章小結

第5章 機器學習算法

5.1 kmeans算法

5.1.1 計算流程

5.1.2 計算元素所屬分類

5.1.3 更新分類中心

5.1.4 入口函數

5.2 KNN算法

5.2.1 計算步驟

5.2.2 相似度計算

5.2.3 求前k個相似度較大元素

5.2.4 統計所屬分類

5.3 二維卷積

5.3.1 X86實現

5.3.2 ARM實現

5.3.3 CUDA實現

5.4 四維卷積

5.4.1 X86實現

5.4.2 ARM 實現

5.4.3 CUDA實現

5.5 多GPU并行優化深度學習軟件Caffe

5.5.1 為什么要使用多GPU并行Caffe

5.5.2 AlexNet示例

5.5.3 Caffe的主要計算流程

5.5.4 多GPU并行卷積神經網絡的方式

5.5.5 多GPU并行Caffe實踐

5.6 本章小結

網友評論(不代表本站觀點)

來自無昵稱**的評論:

不錯,好評!

2016-08-08 15:51:47
來自無昵稱**的評論:

好評

2016-09-28 15:30:37
來自匿名用**的評論:

專業需要,不錯,排版和內容都很好

2017-08-01 20:39:52

免責聲明

更多出版社
主站蜘蛛池模板: 磐石市| 榆树市| 阜南县| 亳州市| 灵山县| 长白| 古浪县| 定州市| 牙克石市| 淳安县| 兴业县| 曲松县| 宿松县| 牡丹江市| 潍坊市| 中方县| 巴塘县| 井研县| 和平县| 宁蒗| 唐河县| 甘泉县| 新竹县| 贵南县| 潞西市| 嵊泗县| 阿坝县| 枣强县| 昌图县| 广丰县| 泗洪县| 毕节市| 曲靖市| 南溪县| 稷山县| 虎林市| 新蔡县| 曲周县| 黎城县| 界首市| 绥棱县|