大數據數學基礎 (R語言描述)
內容描述
本書全面地講解了在科學領域運用廣泛的數據微積分、線性代數、統計學、數值計算、多元統計分析等數學基礎知識。全書共6章:第1章介紹了大數據與數學、數學與R語言的關系;第2章介紹了微積分的基礎知識,包括函數、極限、導數、微分、不定積分與定積分及其應用;第3章介紹了線性代數的基礎知識,包括矩陣的運算、行列式、特徵分解、奇異值分解;第4章介紹了統計學的基礎知識,包括數據分佈特徵、概率論、隨機變量的數字特徵、參數估計、假設檢驗;第5章介紹了數值計算的基礎知識,包括插值方法、函數逼近與擬合、非線性方程(組)求根;第6章介紹了常用的多元統計分析方法,包括回歸分析、聚類分析、判別分析、主成分分析、因子分析和典型相關分析。本書中的幾乎所有實例都結合R語言進行求解分析,所有章後都有課後習題,可以幫助讀者鞏固所學的內容。
目錄大綱
第1章緒論1
1.1大數據與數學1
1.1.1大數據的定義1
1.1.2數學在大數據領域的作用2
1.2數學與R語言4
1.2.1 base 5
1.2.2 stats 5
小結6
課後習題6
第2章微積分基礎8
2.1函數與極限8
2.1.1映射與函數9
2.1.2數列與函數的極限14
2.1.3極限運算法則與存在法則17
2.1.4連續函數的運算與初等函數的連續性18
2.2導數與微分19
2.2.1導數的概念19
2.2.2函數的求導法則24
2.2.3微分的概念26
2.3微分中值定理與導數的應用30
2.3.1微分中值定理30
2.3.2函數的單調性與曲線的凹凸性31
2.3.3函數的極值與最值34
2.4不定積分與定積分39
2.4.1不定積分的概念與性質40
2.4.2換元積分法與分部積分法44
2.4.3定積分的概念與性質46
2.4.4定積分的換元法與分部積分法50
2.4.5不定積分與定積分的實際應用51
小結53
課後習題54
第3章線性代數基礎56
3.1矩陣及其運算56
3.1.1矩陣的定義56
3.1.2特殊矩陣57
3.1.3矩陣的運算61
3.1.4矩陣行列式65
3.1.5矩陣的逆78
3.1.6矩陣的秩80
3.2矩陣的特徵分解與奇異值分解84
3.2.1特徵分解84
3.2.2奇異值分解96
小結100
課後習題101
第4章概率論與數理統計基礎103
4.1數據分佈特徵的統計描述103
4.1.1集中趨勢度量103
4.1.2離散趨勢度量110
4.1.3偏度與峰度的度量115
4.2隨機事件及其概率117
4.2.1隨機事件的定義117
4.2.2隨機事件的概率119
4.3隨機變量與概率分佈122
4.3.1隨機變量的定義122
4.3.2隨機變量的分佈函數122
4.4隨機變量的數字特徵127
4.4.1隨機變量的數學期望127
4.4.2隨機變量的方差130
4.4.3協方差與相關係數132
4.4.4協方差矩陣與相關矩陣134
4.5參數估計與假設檢驗137
4.5.1參數估計137
4.5.2假設檢驗139
小結142
課後習題142
第5章數值計算基礎144
5.1數值計算的基本概念144
5.1 .1誤差的來源144
5.1.2誤差分類146
5.1.3數值計算的衡量標準147
5.2插值法147
5.2.1 Lagrange插值147
5.2.2線性插值150
5.2.3樣條插值152
5.3函數逼近與擬合153
5.3.1數據的最小二乘線性擬合153
5.3.2函數的最佳平方逼近155
5.3.3數據的多變量擬合158
5.3.4數據的非線性曲線擬合160
5.4非線性方程(組)求根162
5.4.1二分法求解非線性方程163
5.4.2 Newton法求解非線性方程165
5.4.3 Newton法求解非線性方程組166
小結169
課後習題170
第6章多元統計分析172
6.1回歸分析172
6.1.1一元線性回歸172
6.1.2多元線性回歸178
6.1.3 Logistic回歸184
6.2聚類分析189
6.2.1距離和相似係數189
6.2.2系統聚類法193
6.2.3動態聚類法198
6.3判別分析200
6.3.1距離判別200
6.3.2貝葉斯判別204
6.3.3費希爾判別205
6.4主成分分析206
6.4.1總體主成分207
6.4.2樣本主成分209
6.5因子分析211
6.5.1正交因子模型212
6.5.2參數估計214
6.5. 3因子旋轉218
6.5.4因子得分220
6.6典型相關分析222
6.6.1總體典型相關222
6.6.2樣本典型相關223
6.6.3典型相關係數的顯著性檢驗228
小結229
課後習題230
附錄I t分佈表236
附錄II F分佈表238
參考文獻250
作者介紹
張良均,高級信息系統項目管理師,泰迪杯全國大學生數據挖掘競賽(www.tipdm.org)發起人。華南師範大學、廣東工業大學兼職教授,廣東省工業與應用數學學會理事。兼有大型高科技企業和高校的工作經歷,主要從事大數據挖掘及其應用的策劃、研發及諮詢培訓。全國計算機技術與軟件專業技術資格(水平)考試繼續教育和CDA數據分析師培訓講師。發表數據挖掘相關論文數20餘篇,已取得國家發明專利12項,主編《Hadoop大數據分析與挖掘實戰》《Python數據分析與挖掘實戰》《R語言數據分析與挖掘實戰》等多本暢銷圖書,主持並完成科技項目9項。獲得SAS、SPSS數據挖掘認證及Hadoop開發工程師證書,具有電力、電信、銀行、製造企業、電子商務和電子政務的項目經驗和行業背景。