Python 大數據特訓班:資料自動化收集、整理、清洗、儲存、分析與應用實戰, 2/e (附300分鐘影音教學/範例程式)

Python 大數據特訓班:資料自動化收集、整理、清洗、儲存、分析與應用實戰, 2/e (附300分鐘影音教學/範例程式)

作者: 鄧文淵 總監製 文淵閣工作室
出版社: 碁峰資訊
出版在: 2020-06-01
ISBN-13: 9789865025175
ISBN-10: 9865025175
裝訂格式: 平裝
總頁數: 352 頁





內容描述


熱銷最新升級增強版!

迅速掌握資料處理要領,深入全方位專案主題
立即體驗Python的大數據超強實戰力!

面對大數據資料
如何爬取?如何整理?如何儲存?
如何分析?如何呈現?最後要如何應用?
就從熱門案例切入,快速搜集梳理海量資訊!

熱門搜尋關鍵字、股票的交易資訊、政府的公開資料、社群網站上傳的圖片與影音,以及實體通路或網路商店的銷售數據…等,都讓資料量快速爆增。大數據時代來臨,不僅科技業重視,就連傳統的零售業、金融業、製造業、旅遊業,以及政府都爭相投入,無不希望能運用數據分析與預測來協助決策方向,掌握數據就能找出趨勢的出路與提高判斷的精準度,也讓新興的數據分析師、資料分析師、資料科學家成為熱門職業。

Python無疑是大數據與AI時代第一程式語言,在數據資料處理的領域中有著非常重要的地位。本書由生活出發,以專題實戰,只要能掌握數據資料爬取清洗、儲存整理、統計分析、視覺化呈現,以及跨領域應用的關鍵技術,就能掌控大數據的應用。

■快速建置便利的Python開發環境,一次學會資料科學的實用模組。
■完整學習Python資料處理的4大觀念與技術:爬取清理、讀取儲存、統計分析、呈現與應用。
■全面深入不同應用面向,如:網路爬蟲、資料正規化、資料視覺化、資料儲存與讀取(CSV、Excel、Google試算表、多媒體檔案擷取…)、批次檔案下載、公開資料應用、API建立…
■以最多元的熱門實例進行大數據專案實作,如:LINE貼圖收集、線上相簿批次下載、YouTube影片及播放清單下載、字幕與音檔下載,股票市場個股分析統計圖、股價資訊即時推播、網路新書排行榜、人力銀行求職資訊分析、超商門市資訊收集、即時網路聲量輿情觀察、鄉鎮市區天氣預報,以及Web API開發…
■範例程式另提供Python筆記神器:Jupyter Notebook格式檔案,讓學習與操作更便利。
■針對專案實戰提供影音輔助教學,加速學習效率。

書附超值學習資源:300分鐘專案實戰影音教學/範例程式檔/「口罩何處尋?」 健保藥局資料爬蟲教學影片  

<序>
這是個充滿數據資料的年代,「資料科學家」已成為一個新興的職業,目前不僅科技產業在持續招聘相關人員,連傳統的零售業、銀行業、製造業、旅遊業,甚至政府單位都相繼成立資料科學部門,試著利用數據分析與預測提供決策方向,期待能增加效率與營收。
Python無疑是大數據與AI 時代的第一程式語言,在數據資料處理的領域中有著非常重要的地位。本書由生活出發,用專題實戰,只要能掌握數據資料爬取清洗、儲存整理、統計分析、視覺化呈現,以及跨領域應用的關鍵技術,就能掌控大數據的應用。
在章節的安排上,著重於資料科學中的基本觀念建立,Python語法函數模組的應用,並透過資料分析實作演練,完整培養數據分析開發領域的基本功,掌握未來趨勢關鍵。我們更細心挑選了許多有趣又實用的專題,讓學習能由日常的細節取材、由生活的內容下手,其中包含了熱門搜尋關鍵字、股票的交易資訊、政府的公開資料、社群網站上傳的圖片與影音,以及實體通路或網路商店的銷售數據⋯等,帶領讀者掌握Python資料科學的實用模組,以貼近生活的熱門專題實戰,期待讓讀者能快速提升實作功力,應用無時差!
讀者除了可以根據書上的內容與說明進行練習,筆者更針對每個實戰專題都錄製了操作的教學影片,讀者在閱讀的過程中,如碰到覺得難以透過文字理解的細節,便能夠利用影片來學習,當下就能得到立即的幫助。
Python在資料爬取、數據分析的強大技能絕對可以大大增強你在學業、工作及職場上的競爭力,只要掌握關鍵技術搞定資料爬取分析,視覺化呈現以及儲存交換應用,Python將成為你晉升數據分析師或資料科學家的敲門磚,一起進入Python大數據的世界吧!


目錄大綱


CH01 建置Python開發環境
1.1 建置Anaconda開發環境
1.2 Spyder編輯器
1.3 Jupyter Notebook編輯器
CH02 數據資料的爬取
2.1 requests模組:讀取網站檔案
2.2 BeautifulSoup模組:網頁解析
2.3 使用正規表達式
2.4 Selenium模組:瀏覽器自動化操作
CH03 數據資料的儲存與讀取
3.1 檔案的讀寫
3.2 csv資料的讀取與寫入
3.3 json資料的儲存與讀取
3.4 Excel資料儲存與讀取
3.5 SQLite資料庫的操作
3.6 MySQL資料庫的操作
3.7 Google試算表的操作
CH04 數據資料視覺化
4.1 繪製折線圖:plot
4.2 繪製長條圖:bar、barh
4.3 繪製散佈圖:scatter
4.4 繪製圓餅圖:pie
4.5 設定圖表區:figure
4.6 在圖表區加入多張圖表:subplot、axes
CH05 Numpy數據運算
5.1 Numpy陣列建立與取值
5.1 Numpy陣列建立與取值
CH06 Pandas資料處理
6.1 Pandas Series的建立與取值
6.2 Pandas DataFrame的建立
6.3 DataFrame資料取值
6.4 DataFrame資料操作
6.5 Pandas資料存取
6.6 Pandas模組:繪圖應用
6.7 Pandas資料清洗
CH07 LINE貼圖收集器
7.1 專題方向
7.2 關鍵技術
7.3 實戰:LINE貼圖收集器
CH08 Youtube影片資源下載
8.1 專題方向
8.2 關鍵技術
8.3 實戰:YouTube影片及相關資源下載
CH09 運動相簿批次爬取
9.1 專題方向
9.2 關鍵技術
9.3 實戰:運動相簿批次爬取
CH10 台灣股票市場分析統計圖
10.1 專題方向
10.2 關鍵技術
10.3 實戰:個股單月與年度統計圖
CH11 行動股市即時報價
11.1 專題方向
11.2 關鍵技術
11.3 實戰:用LINE傳送即時股價
CH12 網路書店新書排行榜
12.1 專題方向
12.2 關鍵技術
12.3 實戰:網路書店新書排行榜
CH13 人力銀行網站求職小幫手
13.1 專題方向
13.2 關鍵技術
13.3 實戰:1111人力銀行求職小幫手
CH14 7-11超商門市資料下載
14.1 專題方向
14.2 關鍵技術
14.3 實戰:7-11超商門市資料下載
CH15 即時網路聲量輿情收集器
15.1 專題方向
15.2 關鍵技術
15.3 實戰:即時網路聲量輿情資料下載
CH16 鄉鎮市區天氣預報及建立API
16.1 專題方向
16.2 關鍵技術
16.3 實戰:查詢鄉鎮市區天氣預報及建立API
16.4 部署Web API到Heroku


作者介紹


一個致力於資訊圖書創作二十餘載的工作團隊,擅長用輕鬆詼諧的筆觸,深入淺出介紹難懂的 IT 技術,並以範例帶領讀者學習電腦應用的大小事。
我們不賣弄深奧的專有名辭,奮力堅持吸收新知的態度,誠懇地與讀者分享在學習路上的點點滴滴,讓軟體成為每個人改善生活應用、提昇工作效率的工具。
舉凡程式開發、文書處理、美工動畫、攝影修片、網頁製作,都是我們專注的重點,而不同領域有各自專業的作者組成,以進行書籍的規劃與編寫。一直以來,感謝許多讀者與學校老師的支持,選定為自修用書或授課教材。衷心期待能盡我們的心力,幫助每一位讀者燃燒心中的小宇宙,用學習的成果在自己的領域裡發光發熱!
我們期待自己能在每一本創作中注入快快樂樂的心情來分享, 也期待讀者能在這樣的氛圍下快快樂樂的學習。
官方網站:www.e-happy.com.tw
FB粉絲團:www.facebook.com/ehappytw




相關書籍

深入理解 React Router:從原理到實踐

作者 李楊韜

2020-06-01

Adobe LiveCycle Designer: Creating Dynamic PDF and HTML5 Forms for Desktop and Mobile Applications, 2/e (Paperback)

作者 J. P. Terry Terry

2020-06-01

最潮 HTML5 + CSS3 網頁版型設計 Standard Layout‧Grid Layout‧Single Page Layout

作者 吉田真麻 李保宜 楊瑩瑩譯

2020-06-01