數據算法:Hadoop/Spark大數據處理技巧

數據算法:Hadoop/Spark大數據處理技巧

作者: Mahmoud Parsian(馬哈默德·帕瑞斯安)
出版社: 中國電力
出版在: 2016-10-01
ISBN-13: 9787512395947
ISBN-10: 7512395949
裝訂格式: 平裝
總頁數: 696 頁





內容描述


《數據算法:Hadoop/Spark大數據處理技巧》介紹了很多基本設計模式、優化技術和數據挖掘及機器學習解決方案,以解決生物信息學、基因組學、統計和社交網絡分析等領域的很多問題。這還概要介紹了MapReduce、Hadoop和Spark。
主要內容包括:
完成超大量交易的購物籃分析。
數據挖掘算法(K-均值、KNN和樸素貝葉斯)。
使用超大基因組數據完成DNA和RNA測序。
樸素貝葉斯定理和馬爾可夫鏈實現數據和市場預測。
推薦算法和成對文檔相似性。
線性回歸、Cox回歸和皮爾遜(Pearson)相關分析。
等位基因頻率和DNA挖掘。
社交網絡分析(推薦系統、三角形計數和情感分析)。




相關書籍

Ruby For Kids (Paperback)

作者 Christopher Haupt

2016-10-01

JavaScript 函數式編程指南

作者 路易斯·阿泰西奧 (Luis Atencio)

2016-10-01

Django 項目實例精解, 2/e

作者 [美]安東尼奧?米勒 李 偉 譯

2016-10-01