Hadoop高級數據分析:使用Hadoop生態系統設計和構建大數據系統
內容描述
掌握Hadoop高級數據分析技術 學習高級分析技術,並利用現有工具包使分析應用更加強大、精確和高效!《Hadoop高級數據分析 使用Hadoop生態系統設計和構建大數據系統》將架構、設計及實現信息恰當地融為一體,將指導你創建超越基礎方法(SF分類、聚類、推薦)的分析系統。 在《Hadoop 高級數據分析 使用Hadoop 生態系統設計和構建大數據系統》中,最好實踐強調“確保連貫、高效的開發”。將使用包含工具箱、庫、可視化組件和報表代碼在內的標準第三方組件,借助集成“組合件”開發一個可運行的、可擴展的、端到端的完整示例系統。《Hadoop 高級數據分析 使用Hadoop 生態系統設計和構建大數據系統》強調以下四點:● 具有分析組件及合理可視化結果的完整、靈活、可配置、高性能數據管道系統的重要性。深入探討的主題包括Spark、H2O、Vopal Wabbit(NLP)、Stanford NLP、Apache Mahout,以及其他適用的工具包、庫和插件。● 最好實踐和結構化設計原則。包括重要主題及示例部分。● 用混合搭配或混合系統實現應用目標的重要性。你在學習深度示例時可體會到混合方法的重要性。● 使用現有第三方庫是有效開發的關鍵。在開發示例系統時,深度示例將展示一些第三方工具包的功能。海報: