成人久久精品一区二区三区_91久久成人免费_久久久久综合网久久_久久久久久无码国产精品中文字幕

數據產品

——? PRODUCTS CENTER? ——

《大數據處理框架Apache Spark設計與實現》
更新時間:2023/04/01
《大數據處理框架Apache Spark設計與實現》

內容簡介

近年來,以Apache Spark為代表的大數據處理框架在學術界和工業界得到了廣泛的使用。本書以Apache Spark框架為核心,總結了大數據處理框架的基礎知識、核心理論、典型的Spark應用,以及相關的性能和可靠性問題。本書分9章,主要包含四部分內容。*部分 大數據處理框架的基礎知識(第1~2章):介紹大數據處理框架的基本概念、系統架構、編程模型、相關的研究工作,并以一個典型的Spark應用為例概述Spark應用的執行流程。第二部分 Spark大數據處理框架的核心理論(第3~4章):介紹Spark框架將應用程序轉化為邏輯處理流程,進而轉化為可并行執行的物理執行計劃的一般過程及方法。第三部分 典型的Spark應用(第5章):介紹迭代型的Spark機器學習應用和圖計算應用。第四部分 大數據處理框架性能和可靠性保障機制(第6~9章):介紹Spark框架的Shuffle機制、數據緩存機制、錯誤容忍機制、內存管理機制等。

作者簡介

許利杰現任中國科學院軟件研究所副研究員、碩士生導師,于中科院軟件所獲得博士學位。當前主要從事大數據系統方面的研究工作,已在國際權威會議如VLDB、ICDCS、IPDPS、ISSRE、ICAC等發表論文10余篇,主持多項國家自然科學基金,以及華為、、聯想等企業的合作研發項目。曾為Apache Spark和Hadoop修復多個內核代碼嚴重錯誤,編寫的SparkInternals技術文檔被社區廣泛關注,獲得四千多顆星。博士期間曾在微軟亞洲研究院、阿里巴巴、騰訊擔任客座研究學生。目前還擔任中國計算機學會系統軟件專委會委員、中國科學院青年創新促進會會員。方亞芬現任中國科學院軟件研究所工程師,于南開大學獲得學士學位、中科院軟件所獲得碩士學位。當前主要從事大數據系統、操作系統方面的研發工作,參與多項國家自然科學基金、國家重點研發計劃,以及華為、騰訊、中國郵政等企業的合作研發項目。曾在阿里巴巴等擔任客座研究學生,目前是華為openEuler社區樹莓派項目負責人。

目  錄

第 1 章 大數據處理框架概覽 .....................2
1.1 大數據及其帶來的挑戰 .....................2
1.2 大數據處理框架 ........................3
1.3 大數據應用及編程模型 .....................4
1.4 大數據處理框架的四層結構 ...................5
1.4.1 用戶層 .......................... 7
1.4.2 分布式數據并行處理層 ...................11
1.4.3 資源管理與任務調度層 ...................13
1.4.4 物理執行層 ........................15
1.5 錯誤容忍機制 .........................17
1.6 其他大數據處理框架 ......................18
1.7 本章小結 ...........................18
1.8 擴展閱讀 ...........................18
第 2 章 Spark 系統部署與應用運行的基本流程 .............20
2.1 Spark 安裝部署 ........................20
2.2 Spark 系統架構 ........................21
2.3 Spark 應用例子 ........................24
2.3.1 用戶代碼基本邏輯 ................... .24
2.3.2 邏輯處理流程 ....................... 28
2.3.3 物理執行計劃 ....................... 32
2.3.4 可視化執行過程 ...................... 34
2.4 Spark 編程模型 ........................38
2.5 本章小結 ...........................39
第 3 章 Spark 邏輯處理流程 ...................41
3.1 Spark 邏輯處理流程概覽 ....................41
3.2 Spark 邏輯處理流程生成方法 ..................43
3.2.1 根據應用程序如何產生 RDD,產生什么樣的 RDD ......... 44
3.2.2 如何建立 RDD 之間的數據依賴 關系............ 44
3.2.3 如何計算 RDD 中的數據 .................. 49
3.3 常用 transformation() 數據操作 ................50
3.4 常用 action() 數據操作 ..................86
3.5 對比 MapReduce,Spark 的優缺點...............98
3.6 本章小結 .........................99
3.7 擴展閱讀 .........................100
第 4 章 Spark 物理執行計劃 ...................101
4.1 Spark 物理執行計劃概覽 ..................101
4.2 Spark 物理執行計劃生成方法 ................105
4.3 常用數據操作生成的物理執行計劃...............113
4.4 本章小結 .........................121
4.5 擴展閱讀 .........................121
第 5 章 迭代型 Spark 應用 ...................123
5.1 迭代型 Spark 應用的分類及特點...............123
5.2 迭代型機器學習應用 SparkLR ................124
5.2.1 應用描述 ........................124
5.2.2 算法原理 ....................... 125
5.2.3 基于 Spark 的并行化實現 ................ 129
5.2.4 深入討論 ....................... 131
5.3 迭代型機器學習應用――廣義 線性模型............132
5.3.1 算法原理 ....................... 132
5.3.2 基于 Spark 的并行化實現 ................ 136
5.3.3 深入討論 ....................... 139
5.4 迭代型圖計算應用――PageRank ...............140
5.4.1 應用描述 ....................... 140
5.4.2 基于 Spark 的并行化實現 ................ 143
5.4.3 深入討論 ....................... 149
5.5 本章小結 .........................151
第 6 章 Shuffle 機制 ......................153
6.1 Shuffle 的意義及設計挑戰 .................153
6.2 Shuffle 的設計思想 ....................155
6.2.1 解決數據分區和數據聚合問題 ...............156
6.2.2 解決 map() 端 combine問題 ............... 158
6.2.3 解決 sort 問題 ..................... 158
6.2.4 解決內存不足問題 .................... 159
6.3 Spark 中 Shuffle 框架的設計 ...............160
6.3.1 Shuffle Write 框架設計和實現 ............... 161
6.3.2 Shuffle Read 框架設計和實現 ............. 166
6.4 支持高效聚合和排序的數據 結構..............170
6.4.1 AppendOnlyMap 的原理 ................. 171
6.4.2 ExternalAppendOnlyMap ................173
6.4.3 PartitionedAppendOnlyMap .............. 176
6.4.4 PartitionedPairBuffer ................ 176
6.5 與 Hadoop MapReduce 的 Shuffle 機制對比.........177
6.6 本章小結 ........................179
第 7 章 數據緩存機制 ......................180
7.1 數據緩存的意義 ......................180
7.2 數據緩存機制的設計原理 ..................181
7.2.1 決定哪些數據需要被緩存 ................181
7.2.2 包含數據緩存操作的邏輯處理流程和物理執行計劃 ..... 184
7.2.3 緩存級別 ....................... 186
7.2.4 緩存數據的寫入方法 ..................189
7.2.5 緩存數據的讀取方法 .................. 191
7.2.6 用戶接口的設計 .................... 192
7.2.7 緩存數據的替換與回收方法 .................193
7.3 與 Hadoop MapReduce 的緩存機制進行對比............197
7.4 本章小結 ..........................198
第 8 章 錯誤容忍機制 ......................199
8.1 錯誤容忍機制的意義及挑戰 ..................199
8.2 錯誤容忍機制的設計思想 ...................201
8.3 重新計算機制 ........................201
8.3.1 重新計算是否能夠得到與之前一樣的結果 .......... 202
8.3.2 從哪里開始重新計算 ...................204
8.3.3 重新計算機制小結 ....................207
8.4 checkpoint 機制的設計與實現 ................207
8.4.1 哪些數據需要使用 checkpoint機制 ............ 207
8.4.2 checkpoint 數據的寫入及接口 ...............210
8.4.3 checkpoint 時機及計算順序 ................212
8.4.4 checkpoint 數據的讀取 .......... .......213
8.4.5 checkpoint 數據寫入和讀取的實現細節 .......... 213
8.4.6 checkpoint 語句位置的影響.... ..........216
8.4.7 cache checkpoint .................. 220
8.5 checkpoint 與數據緩存的區別 ...............225
8.6 本章小結 .........................226
第 9 章 內存管理機制 ......................227
9.1 內存管理機制問題及挑戰 .................227
9.2 應用內存消耗來源及影響因素 ..............228
9.2.1 內存消耗來源 1:用戶代碼 .............. 229
9.2.2 內存消耗來源 2:Shuffle 機制中產生的中間數據 ......230
9.2.3 內存消耗來源 3:緩存數據 .............. 231
9.3 Spark 框架內存管理模型 ..................232
9.3.1 靜態內存管理模型 .................... 233
9.3.2 統一內存管理模型 .................... 234
9.4 Spark 框架執行內存消耗與管理................237
9.4.1 Shuffle Write 階段內存消耗及管理 ............ 239
9.4.2 Shuffle Read 階段內存消耗及管理 ............. 245
9.5 數據緩存空間管理 .......................249
9.5.1 RDD 緩存數據 ....................... 250
9.5.2 廣播數據 ......................... 253
9.5.3 task 的計算結果 ..................... 254
9.6 本章小結 ..........................256
參考文獻 ............................258

上一頁:已經為第一條
上一頁:已經為第一條

相關推薦

在線咨詢

在線留言
成人久久精品一区二区三区_91久久成人免费_久久久久综合网久久_久久久久久无码国产精品中文字幕
<abbr id="xo7c3"></abbr><abbr id="xo7c3"><noframes id="xo7c3">

  • <blockquote id="xo7c3"><xmp id="xo7c3">

    <noscript id="xo7c3"><tbody id="xo7c3"></tbody></noscript>
      <dl id="xo7c3"><acronym id="xo7c3"><dl id="xo7c3"></dl></acronym></dl>
    1. <abbr id="xo7c3"><noframes id="xo7c3">

    2. 另类天堂视频在线观看| 国产精品电影网站| 亚洲全黄一级网站| 一本色道久久综合亚洲精品高清 | 欧美制服丝袜| 免费不卡视频| 正在播放亚洲| 国产亚洲永久域名| 欧美激情欧美激情在线五月| 中文在线资源观看网站视频免费不卡| 欧美一区二区免费观在线| 精品成人一区二区| 欧美日韩精品一区二区天天拍小说| 亚洲网站在线看| 免费观看成人www动漫视频| 99ri日韩精品视频| 国产一区二区av| 欧美精品日韩www.p站| 午夜精品久久久久久99热软件| 欧美成人高清| 午夜国产精品视频免费体验区| 极品少妇一区二区三区精品视频| 欧美精品一区二区三区高清aⅴ| 亚洲综合国产| 91久久国产综合久久蜜月精品 | 国产精品劲爆视频| 久久精品人人| 亚洲性av在线| 亚洲精品日韩综合观看成人91| 欧美在线免费观看| 亚洲视频www| 亚洲韩国青草视频| 国产一区999| 国产精品国产三级国产aⅴ浪潮| 久久亚洲综合| 欧美在线你懂的| 亚洲视频成人| 亚洲欧洲一区二区天堂久久 | 欧美一级午夜免费电影| 99国产精品| 亚洲高清二区| 免费视频一区| 久久影音先锋| 久久精品视频在线| 午夜一区二区三区在线观看| 99精品欧美一区二区三区综合在线| 影音先锋亚洲视频| 国产亚洲欧美一区二区三区| 国产精品免费一区豆花| 欧美日韩日本视频| 欧美精品国产| 欧美国产第一页| 免费在线日韩av| 久久先锋影音| 久久亚洲精品视频| 久久蜜桃资源一区二区老牛| 久久av资源网| 久久成人精品| 久久久av水蜜桃| 久久精品99久久香蕉国产色戒| 亚洲欧美日韩国产综合| 亚洲一区二区三区四区五区午夜| 一区二区三区久久久| 9国产精品视频| 亚洲美女精品一区| 日韩视频一区二区三区在线播放| 亚洲人成网站精品片在线观看 | 国产欧美日韩视频在线观看| 国产精品日韩在线播放| 国产精品亚洲а∨天堂免在线| 国产精品入口福利| 国产欧美一区二区三区久久| 国产精品亚洲片夜色在线| 国产精品一区二区你懂得| 国产精品一区视频| 国产一区二区主播在线| 激情五月综合色婷婷一区二区| 黄色精品一区| 亚洲片在线资源| 一区二区三区日韩在线观看| 亚洲小说欧美另类社区| 欧美一区二区三区免费观看 | 亚洲欧洲99久久| 欧美在线免费一级片| 蜜臀91精品一区二区三区| 欧美激情按摩在线| 国产精品国产三级国产| 国产自产女人91一区在线观看| 影音先锋久久久| 一区二区av在线| 香蕉av福利精品导航| 久久久久久亚洲精品杨幂换脸| 免费看av成人| 亚洲毛片在线| 午夜免费日韩视频| 米奇777超碰欧美日韩亚洲| 欧美日本国产| 国产一区二区毛片| 亚洲毛片在线观看| 欧美一区在线视频| 亚洲第一成人在线| 亚洲一区观看| 免费试看一区| 国产精品一二三四区| 亚洲国产清纯| 亚洲一区激情| 欧美成人午夜激情| 亚洲一区二区三区影院| 狂野欧美性猛交xxxx巴西| 欧美三区美女| 在线日本成人| 午夜久久tv| 亚洲国产高清在线| 午夜精品在线| 欧美理论在线| 在线成人av.com| 亚洲欧美激情诱惑| 欧美国产一区视频在线观看| 亚洲一区欧美二区| 欧美韩日视频| 很黄很黄激情成人| 亚洲女同精品视频| 亚洲品质自拍| 老司机精品视频一区二区三区| 国产精品视屏| 这里只有精品视频在线| 欧美成人免费网站| 欧美一区二区观看视频| 欧美三级在线视频| 日韩视频在线一区| 欧美成人国产一区二区| 午夜国产不卡在线观看视频| 欧美日韩中文精品| 日韩亚洲欧美高清| 欧美高清在线一区二区| 欧美一区二区国产| 国产精品日韩欧美大师| 亚洲一区二区三区色| 亚洲人体一区| 欧美成人精品一区| 亚洲国产成人高清精品| 久久久久久久一区二区三区| 亚洲一区区二区| 国产精品v欧美精品∨日韩| 一个色综合导航| 亚洲精品美女免费| 欧美极品在线播放| 亚洲毛片一区二区| 91久久精品国产| 欧美风情在线观看| 亚洲日本成人网| 亚洲黑丝在线| 欧美肥婆在线| 夜夜嗨av一区二区三区中文字幕| 亚洲国产综合91精品麻豆| 欧美福利精品| 日韩一级网站| 日韩视频在线一区| 欧美性片在线观看| 午夜天堂精品久久久久| 亚洲欧美日韩国产一区二区| 国产欧美日韩视频一区二区三区| 久久国产成人| 久久久久久91香蕉国产| 亚洲国产精品久久久久秋霞不卡| 欧美暴力喷水在线| 欧美成人免费观看| 99在线精品视频在线观看| 夜夜夜精品看看| 国产欧美日韩一区| 久久综合给合| 欧美成人精品1314www| av不卡在线| 亚洲综合二区| 在线播放亚洲一区| 亚洲激情在线| 国产精品久久久久婷婷| 久久精品亚洲一区二区三区浴池| 久久经典综合| 日韩视频一区二区三区| 亚洲视频综合在线| 韩国福利一区| 91久久午夜| 国产精品永久免费在线| 免费不卡亚洲欧美| 欧美日韩亚洲一区二区三区在线观看| 亚洲欧美日韩中文视频| 久久久av毛片精品| 中国av一区| 久久精品99国产精品酒店日本| 亚洲精品欧美精品| 亚洲欧美区自拍先锋| 亚洲国产欧美在线人成| 亚洲午夜一区二区三区| 在线日韩欧美| 亚洲视频电影图片偷拍一区| 尹人成人综合网| 一区二区成人精品| 亚洲黄网站在线观看| 亚洲视频狠狠|