數據算法:Hadoop/Spark大數據處理技巧

數據算法:Hadoop/Spark大數據處理技巧

作者: Mahmoud Parsian(馬哈默德·帕瑞斯安)
出版社: 中國電力
出版在: 2016-10-01
ISBN-13: 9787512395947
ISBN-10: 7512395949
裝訂格式: 平裝
總頁數: 696 頁





內容描述


《數據算法:Hadoop/Spark大數據處理技巧》介紹了很多基本設計模式、優化技術和數據挖掘及機器學習解決方案,以解決生物信息學、基因組學、統計和社交網絡分析等領域的很多問題。這還概要介紹了MapReduce、Hadoop和Spark。
主要內容包括:
完成超大量交易的購物籃分析。
數據挖掘算法(K-均值、KNN和樸素貝葉斯)。
使用超大基因組數據完成DNA和RNA測序。
樸素貝葉斯定理和馬爾可夫鏈實現數據和市場預測。
推薦算法和成對文檔相似性。
線性回歸、Cox回歸和皮爾遜(Pearson)相關分析。
等位基因頻率和DNA挖掘。
社交網絡分析(推薦系統、三角形計數和情感分析)。




相關書籍

Refactoring JavaScript: Turning Bad Code Into Good Code

作者 Evan Burchard

2016-10-01

Ruby 程序員修煉之道 (第2版) (The Well-Grounded Rubyist, Second Edition)

作者 戴維 A.布萊克 (David A. Black)

2016-10-01

Blazor WebAssembly by Example: A project-based guide to building web apps with .NET, Blazor WebAssembly, and C#

作者 Wright Toi B.

2016-10-01