Python 數據分析基礎 (Foundations for Analytics with Python)

Python 數據分析基礎 (Foundations for Analytics with Python)

作者: 克林頓·布朗利 (Clinton W. Brownley)
出版社: 人民郵電
出版在: 2017-08-01
ISBN-13: 9787115463357
ISBN-10: 7115463352
裝訂格式: 平裝
總頁數: 247 頁





內容描述


本書展示如何用Python程序將不同格式的數據處理和分析任務規模化和自動化。主要內容包括:Python基礎知識介紹、CSV文件和Excel文件讀寫、數據庫的操作、示例程序演示、圖表的創建,等等。


目錄大綱


前言
第1章Python基礎1 
1.1創建Python腳本1 
1.2運行Python腳本3 
1.3與命令行進行交互的幾項技巧6 
1.4Python語言基礎要素10 
1.4.1數值10 
1.4.2字符串12 
1.4.3正則表達式與模式匹配16 
1.4.4日期19 
1.4.5列表21 
1.4.6元組26 
1.4.7字典27 
1.4.8控制流30 
1.5讀取文本文件35 
1.5.1創建文本文件36 
1.5.2腳本和輸入文件在同一位置38 
1.5.3讀取文件的新型語法38 
1.6使用glob讀取多個文本文件39 
1.7寫入文本文件42 
1.7.1向first_script.py添加代碼42 
1.7.2寫入CSV文件45 
1.8print語句46 
1.9本章練習47 
第2章CSV文件48 
2.1基礎Python與pandas50 
2.1.1讀寫CSV文件(第1部分)50 
2.1.2基本字符串分析是如何失敗的56 
2.1.3讀寫CSV文件(第2部分)57 
2.2篩選特定的行58 
2.2.1行中的值滿足某個條件59 
2.2.2行中的值屬於某個集合60 
2.2.3行中的值匹配於某個模式/正則表達式62 
2.3選取特定的列64 
2.3.1列索引值64 
2.3.2列標題65 
2.4選取連續的行67 
2.5添 標題行69 
2.6讀取多個CSV文件71 
2.7從多個文件中連接數據75 
2.8計算每個文件中值的總和與均值78 
2.9本章練習81 
第3章Excel文件82 
3.1內省Excel工作簿84 
3.2處理單個工作表88 
3.2.1讀寫Excel文件88 
3.2.2篩選特定行92 
3.2.3選取特定列98 
3.3讀取工作簿中的所有工作表101 
3.3.1在所有工作表中篩選特定行102 
3.3.2在所有工作表中選取特定列104 
3.4在Excel工作簿中讀取一組工作表106 
3.5處理多個工作簿108 
3.5.1工作表計數以及每個工作表中的行列計數110 
3.5. 2從多個工作簿中連接數據111 
3.5.3為每個工作簿和工作表計算總數和均值113 
3.6本章練習117 
第4章數據庫118 
4.1Python內置的sqlite3模塊119 
4.1.1向表中插入新記錄124 
4.1.2更新表中記錄128 
4.2MySQL數據庫131 
4.2.1向表中插入新記錄135 
4.2.2查詢一個表並將輸出寫入CSV文件140 
4.2.3更新表中記錄142 
4.3本章練習146 
第5章應用程序147 
5.1在一個大文件集合中查 一組項目147 
5.2為CSV文件中數據的任意數目分類計算統計量158 
5.3為文本文件中數據的任意數目分類計算統計量167 
5.4本章練習174 
第6章圖與圖表175 
6.1matplotlib175 
6.1.1條形圖175 
6.1.2直方圖177 
6.1.3折線圖178 
6.1.4散點圖180 
6.1.5箱線圖181 
6.2pandas183 
6.3ggplot184 
6.4seaborn186 
第7章描述性統計與建模192 
7.1數據集192 
7.1. 1葡萄酒質量192 
7.1.2客戶流失193 
7.2葡萄酒質量194 
7.2.1描述性統計194 
7.2.2分組、直方圖與t檢驗195 
7.2.3成對變量之間的關係和相關性196 
7.2.4使用最小二乘估計進行線性回歸198 
7.2.5係數解釋200 
7.2.6自變量標準化200 
7.2.7預測202 
7.3客戶流失203 
7.3.1邏輯斯蒂回歸205 
7.3.2係數解釋207 
7.3.3預測208 
第8章按計劃自動運行腳本209 
8.1任務計劃程序(Windows系統)209 
8.2cron工具(macOS系統和Unix系統)215 
8.2.1cron表文件:一次性設置216 
8.2.2向cron表文件中添加cron任務216 
第9章從這裡啟航220 
9.1 多的標準庫模塊和內置函數221 
9.1.1Python標準庫(PSL):更多的標準模塊221 
9.1.2內置函數222 
9.2Python包索引(PyPI):更多的擴展模塊222 
9.2.1NumPy223 
9.2.2SciPy227 
9.2.3Scikit—Learn230 
9.2.4更多的擴展包232 
9.3更多的數據結構232 
9.3.1棧233 
9.3.2隊列233 
9.3.3圖233 
9.3.4樹234 
9.4從這裡啟航234 
附錄A下載指南236 
附錄B練習答案245 
作者介紹247 
封面介紹247


作者介紹


作者:[美]克林頓?布朗利(Clinton W. Brownley)譯者:陳光欣
Clinton W. Brownley博士,Facebook數據科學家,負責大數據流水線、統計建模和數據可視化項目,並為大型基礎設施建設提供數據驅動的決策建議。




相關書籍

Power BI 快速入門

作者 全華研究室 郭欣怡

2017-08-01

從機器學習到深度學習:基於scikit-learn與TensorFlow的高效開發實戰

作者 劉長龍

2017-08-01

Algorithmic and Artificial Intelligence Methods for Protein Bioinformatics (Hardcover)

作者 Yi Pan Jianxin Wang Min Li

2017-08-01