深入理解 XGBoost:高效機器學習算法與進階

深入理解 XGBoost:高效機器學習算法與進階

作者: 何龍
出版社: 機械工業
出版在: 2019-12-01
ISBN-13: 9787111642626
ISBN-10: 7111642627





內容描述


本書以機器學習基礎知識做鋪墊,深入剖析XGBoost的原理、分佈式實現、模型優化、深度應用等。
第1~3章使讀者對機器學習算法形成整體認知,瞭解如何優化模型以及評估預測結果,並熟悉常用機器學習算法的實現原理和應用,如線性回歸、邏輯回歸、決策樹、神經網絡、支持向量機等。
第4章借助實際案例,講解如何通過XGBoost解決分類、回歸、排序等問題,並介紹了XGBoost常用功能的使用方法。
第5~7章是本書的重點,從理論推導與源碼層面深入剖析XGBoost,涵蓋XGBoost原理與理論證明、分佈式XGBoost的實現、XGBoost各組件的源碼解析。
第8~9章為進階內容,著重解析算法實踐與工程應用中的難點,進而幫助讀者更好地解決實際問題。
第10章介紹了一些將樹模型與其他模型融合較為前沿的研究方法,以開拓眼界,拓展思路。

隨著企業數據規模的不斷擴大,基於規則解決業務問題的傳統方法已無法滿足企業需求,迫切需要一種高效、準確的方式提升業務指標,如何快速訓練出高準確率的模型成為許多企業面對的挑戰。
XGBoost(eXtreme Gradient Boosting),初驚艷於Kaggle競賽,後以出眾的效率和較高的準確度得到廣泛應用。正如其名,它是Gradient Boosting思想的實現,最大的特點是能夠通過並行實現加速計算,同時在算法上加以改進提高了精度。
XGBoost存在一定的學習門檻,資料又較為分散,缺乏一個系統、完整的學習教程可以參考。作者作為XGBoost開源社區貢獻者,經長期積累與實踐,潛心研思,總結成書,以饗讀者。
理論先行:以機器學習常用算法為鋪墊,打下良好的理論基礎。
夯實基礎:全面覆蓋了決策樹、Gradient Tree Boosting、目標函數近似、切分點查找算法等主要內容。
重視深度:深入闡述了分佈式實現、排序學習、模型解釋性等算法和技術。
案例豐富:算法講解與應用案例相輔相成,以便讀者靈活運用、融會貫通。
此外,本書也可作為算法開發人員的手邊工具書,在學習和工作中隨時查閱參考。




相關書籍

Computer Age Statistical Inference : Algorithms, Evidence, and Data Science (Hardocver)

作者 Bradley Efron Trevor Hastie

2019-12-01

Next Generation of Data Mining (Hardcover)

作者 Hillol Kargupta Jiawei Han Philip S. Yu Rajeev Motwani Vipin Kumar

2019-12-01

人工智能初學者指南

作者 [美]約翰·保羅·穆勒(John Paul Mueller )[法]盧卡·馬薩羅(Luca Massaron)

2019-12-01