數據算法:Hadoop/Spark大數據處理技巧

數據算法:Hadoop/Spark大數據處理技巧

作者: Mahmoud Parsian(馬哈默德·帕瑞斯安)
出版社: 中國電力
出版在: 2016-10-01
ISBN-13: 9787512395947
ISBN-10: 7512395949
裝訂格式: 平裝
總頁數: 696 頁





內容描述


《數據算法:Hadoop/Spark大數據處理技巧》介紹了很多基本設計模式、優化技術和數據挖掘及機器學習解決方案,以解決生物信息學、基因組學、統計和社交網絡分析等領域的很多問題。這還概要介紹了MapReduce、Hadoop和Spark。
主要內容包括:
完成超大量交易的購物籃分析。
數據挖掘算法(K-均值、KNN和樸素貝葉斯)。
使用超大基因組數據完成DNA和RNA測序。
樸素貝葉斯定理和馬爾可夫鏈實現數據和市場預測。
推薦算法和成對文檔相似性。
線性回歸、Cox回歸和皮爾遜(Pearson)相關分析。
等位基因頻率和DNA挖掘。
社交網絡分析(推薦系統、三角形計數和情感分析)。




相關書籍

Web前端開發——HTML5+CSS+JavaScript+ jQuery +Dream

作者 劉敏娜 弋改珍

2016-10-01

深度剖析Hadoop HDFS

作者 林意群

2016-10-01

大數據技術

作者 劉化君 吳海濤 毛其林等

2016-10-01