一行指令學 Python-用 Pandas 掌握商務大數據分析 (附範例光碟)
內容描述
本書特色
●我們強調的並非Python,⽽是pandas。
●我們強調⽤pandas來解決實際問題。
●作者拆解大數據分析中的每一個步驟,配合Python直譯器的特性,讓學習者馬上動手實作,即時理解學習重點。
●如果一個範例的解法不只一種,作者會提供不同的方法,引導學習者嘗試不同的解題方法。
內容簡介
在Python裡,最重要的套件應該是pandas。非資訊專長的初學者要學Python,一定要學pandas,因為它容易入手,而且功能強大。pandas具有強大的資料分析、繪圖能⼒,甚至能做網路爬蟲。將pandas分析結果回存到Excel也是輕而易舉!本書就是著重在pandas的介紹。⽽本書的另一特⾊是,筆者會設計許多⽤Python來解決的問題。研究發現,問題導向學習有助提升學習熱情和學習成效。藉由在實際問題中引發學習動機和熱情,並且親⾃操作,來尋找問題答案並解決問題!Boud(1987)就主張,學習的起點應該始於學習者想要解決的問題、疑問或困擾。因此,我設計的這些問題只是起點,更希望讀者能將這些知識與⽣活或工作遭遇的問題做連結,進一步提出屬於自己的問題,並累積解決問題的技巧。
目錄大綱
第1章 數字與變數
1-1 基本資料型態
1-2 數值
1-3 變數
1-4 輸入與輸出指令
第2章 字串
2-1 字串介紹
2-2 字串的運算
2-3 print 指令列印文字的常用方法
2-4 介紹f_string 的常用方法
2.5 透過方格的繪製來熟練print 和字串
2.6 字串的專用函數
2.7 字串裡的字元切割
2.8 字串裡的文字切割
2.9 字串的性質:內容不可變(Immutable)
第3章 串列
3-1 串列介紹
3-2 創立串列的主要方式
3-3 串列與文字的關係
3-4 串列解開(List Unpacking)
3-5 增加串列元素的方法
3-6 刪除串列可用pop() 方法
3-7 對串列裡的資料進行運算
3-8 串列與for 迴圈的關係
3-9 for 迴圈與串列解開的使用
第4章 迴圈
4-1 for 迴圈基本用法
4-2 如何在for 迴圈中同時取值和其索引位置
4-3 用for 迴圈修改list 的內容
4-4 串列表達式(List Comprehension)
第5章 字典
5-1 如何建立字典資料
5-2 字典如何取值
5-3 串列和字典資料型態的轉換
5-4 字典如何與for 迴圈結合
5-5 集合
第6章 邏輯判斷
6-1 基本邏輯關係
6-2 and, or, not 的語法
6-3 if
6-4 一行if(One-line if)
6-5 一行if 與串列表達式的結合
6-6 在邏輯判斷裡還有一個語法,叫in
第7章 Python的套件與模組
7-1 套件和模組的介紹
7-2 如何自己撰寫函數
7-3 函數的回傳值
7-4 函數的參數數目不固定
7-5 函數的一行寫法(lambda x)
第8章 pandas套件
8-1 創建Series 資料
8-2 Series 物件常用屬性
8-3 利用位置和索引鍵提取Series 的資料
8-4 變更索引鍵
8-5 索引鍵的重要性
8-6 Series 常用的方法
8-7 Series 用來處理「類別型資料」的常用方法
第9章 pandas DataFrame介紹
9-1 創立DataFrame
9-2 DataFrame 的重要屬性(attributes)
2-3 索引鍵自動對齊的功能
9-4 NaN 介紹
9-5 如何定位和讀取DataFrame 裡面的元素
9-6 增加一欄或一列
9-7 介紹axis 的觀念
9-8 如何篩選資料
9-9 將不同的DataFrame 合併
9-10 Dataframe 裡的常用函數
9-11 日期的資料型態
9-12 用apply() 讓資料處理更簡單
第10章 pandas── 繪圖
10-1 單一變數的繪圖
10-2 二維圖形的幾種可能
第11章 多層級索引鍵
11-1 多層級索引鍵的建立
11-2 多層級索引鍵的資料索引和切片
11-3 跨層級的資料索引
11-4 groupby
11-5 分群之後做什麼
11-6 groupby 和多層級索引鍵的關係
11-7 改變欄索引鍵和列索引鍵的位置
第12章 鐵達尼號
12-1 鐵達尼號資料檢視
12-2 從最基本的存亡人數分析
12-3 了解性別跟存活的關係
12-4 了解船艙等級與存活率的關係
12-5 了解船艙等級、性別和存活的關係
12-6 年紀對存活率的影響
12-7 費用與存活率的關係
12-8 父母孩子的數量與存活率的關係
12-9 費用與年紀的關係
第13章 pandas──系所生源分析
13-1 載入資料
13-2 基本資料分析
13-3 交叉分析
13-4 合併不同DataFrame
第14章 pandas──業務銷售分析
14-1 業務單位的分析
14-2 業務單位裡的業務員銷售分析
14-3 業務單位的產品銷售分析
14-4 業務單位的產品銷售分析的總和與百分比表
14-5 其他不同的綜合分析
14-6 銷售時間軸的分析
第15章 pandas──股市分析
15-1 資料載入
15-2 台積電資料基本分析
15-3 日收益率
15-4 股價趨勢研究
15-5 動態資料的呈現
15-6 威廉指標線
15-7 同時處理多家公司的股價資訊
第16章 pandas──問卷資料分析
16-1 基本資料檢查和遺漏值處理
16-2 構面分析
16-3 性別在四個構面的差異
16-4 教育程度在四個構面的差異
16-5 四個構面的相關性分析
16-6 迴歸分析
第17章 pandas──字串處理
17-1 pandas 裡的字串處理
17-2 正規表達式
17-3 處理E-mail
17-4 處理數字型欄位
17-5 處理日期型欄位