
Python 網絡爬蟲從入門到實踐, 2/e
內容描述
使用 Python 編寫網絡爬蟲程序獲取因特網上的大數據是當前的熱門專題。本書內容包括三部分:基礎部分、進階部分和項目實踐部分。基
礎部分(第1~7章)主要介紹爬蟲的三個步驟——獲取網頁、解析網頁和存儲數據,通過諸多示例的講解,讓讀者從基礎內容開始系統性地學
習爬蟲技術,並在實踐中提升 Python 爬蟲水平。進階部分(第8~13章)包括多線程的並發和並行爬蟲、分佈式爬蟲、更換 IP等,幫助讀者
進一步提升爬蟲水平。項目實踐部分(第14~17章)使用本書介紹的爬蟲技術對幾個真實的網站進行抓取,讓讀者能在讀完本書後根據自己的
需求寫出爬蟲程序。
無論你是否有編程基礎,只要對爬蟲技術感興趣,本書就能帶領你從入門到實戰再到進階,一步步瞭解爬蟲,最終寫出自己的爬蟲程序。