數據科學與分析:Python語言實現
內容描述
本書由前IBM首席數據科學家撰寫,旨在為有志成為數據科學家的讀者提供可行的實踐指南。書中以Python為工具,系統介紹當今數據科學和數據分析中使用的一些通用算法,著重展示流行算法及其使用背後的概念和思想,同時提供豐富數據分析案例及代碼示例,幫助你逐步理解晦澀的公式、理論並上手操作。
全書共9章,第1章介紹什麽是數據科學,以及它與各相關學科之間的關系,並且概述數據科學和分析項目的典型工作流程;第2章介紹Python語言的一些重要特性;第3章介紹機器學習、模式識別和人工智能的基本要素;第4章介紹如何通過StatsModels和Scikit-learn使用Python實現回歸分析;第5章討論聚類技術;第6章討論分類算法;第7章介紹分層聚類、決策樹的使用以及套袋和助推等集成技術;第8章討論降維技術;第9章介紹支持向量機算法以及回歸和分類等應用程序中重要的核心技巧。
本書專為在學術與商業領域從事數據科學和數據分析的人員而設計,旨在以Python為工具詳細介紹數據科學和分析中使用的主要概念、技術、方法及一些實用技巧,為立志成為數據科學家的讀者提供可行的實踐指南。
本書特色:
·從處理過程和獲取結果的角度討論數據科學和分析的相關內容。
·各個章節彼此獨立,以便讀者可以輕松地查閱所需內容。
·介紹了Python語言的重要特性,包括Python入門知識。
·著重展示流行算法及其使用背後的概念和思想。
·涵蓋機器學習、模式識別和人工智能的基本要素。
·介紹了數據科學家常用的技術、工具,包括聚類技術、分類算法、集成技術、降維技術等。
·書中示例基於Python 3.5.2實現,並提供經過測試的示例代碼。