高性能分佈式計算系統開發與實現:基於Hadoop、Scalding和Spark
內容描述
本書分兩部分,共8章,介紹瞭如何使用開源工具和技術開發與實現大規模分佈式處理系統,涵蓋構建高性能分佈式計算系統的方法和佳實踐。
第一部分(第1~4章)介紹了高性能分佈式計算編程的基礎知識,包括分佈式系統、Hadoop入門、Spark入門、Scalding入門等;
第二部分(第5~8章)給出了使用Hadoop、Spark、Scalding的案例研究,涉及數據聚類、數據分類、回歸分析、推薦系統等。
本書適合作為高等院校計算機相關專業的教材,也適合作為軟件工程師、應用開發人員、科研人員的參考書。
作者介紹
作者:(印度)KG斯里尼瓦沙
作者:阿尼爾·庫馬爾·穆帕拉
譯者:高輝
譯者:李東昇
譯者:王宏志
KG斯里尼瓦沙(KGSrinivasa)於2007年獲得班加羅爾大學計算機科學與工程博士學位。
現就職於班加羅爾的MS拉邁阿理工學院計算機科學與工程系,任教授兼主任。
他在國際會議和期刊上共發表過一百多篇研究論文,曾作為訪問學者出訪過許多大學。
他是UGC、DRDO和DST資助的多個項目的首席研究員,其研究領域包括數據挖掘、機器學習、高性能計算和雲計算。
他是IEEE和ACM的高級成員。
阿尼爾·庫馬爾·穆帕拉(Anil Kumar Muppalla)既是一位研究者也是一個作家。
具有計算機科學和工程學學位。他是很多行業的軟件開發者和顧問。
他是活躍的研究者,並在國際會議和期刊上發表諸多文章。他研究的方向包括使用Hadoop、Scalding和Spark進行應用開發。