統計學:大數據分析 - EXCEL 實務應用與操作 (修訂版)

統計學:大數據分析 - EXCEL 實務應用與操作 (修訂版)

作者: 古永嘉 楊志清
出版社: 新陸
出版在: 2020-03-20
ISBN-13: 9789869565257
ISBN-10: 9869565255
總頁數: 400 頁





內容描述


現今的生活環境,從政府、社會、經濟、產業、企業、投資與消費,時時刻刻都充滿著大量複雜、多元且具相關性的數據資料,如何運用各種分析工具,將資料從簡單的描述整理到深入地推論分析,以得到有效的管理決策及績效,是一項充滿挑戰的課題,也是各層級組織努力追求的目標。而「統計學」的產生,就是建立在數據分析的基礎上,研究如何將複雜資料轉化為有效管理的重要工具。就時序而言,統計學自17 世紀中葉產生後,已廣泛地應用在自然科學與社會科學,尤其更積極應用於工商企業及政府的情報決策。隨著2001 年巨量資料(Big Data)時代來臨,統計分析、資訊科技及雲端技術密切結合,已成為資料科學(Data Science)中的重要主軸之一。

  統計(Statistics)的意義,是針對研究計畫之目的,將事前預先規劃且已收集到的資料,運用各種分析方法,進行有系統的整理分析,找出變數之間的影響性或關聯性,並歸納出影響結果的重要原因。而這些原因的發現,將有助於縮減未來不確定的狀況,較精準的聚焦於關鍵因素,從而提高管理決策的品質,有效協助管理決策的制定與執行。換言之,統計實務是將統計觀念應用於實際的事務或現象上的估計或預測,再藉由所得到的估計或預測的結果,作為決策的參考。而統計學即是透過樣本資料所得到的分析結果,推論母體特性的一門學科,也就是介紹「統計」相關科學與技術理論的學問。所以,統計實務是在實踐統計學的應用,利用母體的一部分資料(即樣本),透過統計的方法與理論,找出可以得知母體參數或未來趨勢的模型或估計數值。

  美國學者高德納(Donald Ervin Knuth) 於2012 年提出大數據資料分析應涵蓋四個要素(4V),即資料成長數量(Volume)、資料成長速度(Velocity)、資料多元化(Variety)及資料真實性(Veracity)。數據資料
  在4V 的運作狀態下,可作為創造決策的參考。現今人們的生活型態,包括食、衣、住、行、育、樂,時時刻刻都充滿著新的數據資料,若能善用統計及大數據觀念,將可大幅改善管理決策。網路及消費資料愈來愈受到全球重視,已有許多企業運用大量數據分析進行有效的行銷策略,顯見大數據分析已逐漸成為未來行銷的新趨勢。例如:

  1.電信業者透過數以千萬計的客戶資料,能分析出多種使用者行為和趨勢,賣給需要的企業。

  2.電信業者把手機位置信息和互聯網上的信息結合,為顧客提供附近的餐飲店或提供末班車信息服務。

  3.專業服裝業透過Twitter 和Facebook 收集社交信息並進行分析,得出必須保留兩類有價值的顧客:高消費者和高影響者,讓用戶進行口碑宣傳。

  因此,面對經濟及社會的急遽變化,僅靠傳統的經驗與直覺,已不一定能做出最正確的決策模式。而透過統計完成數據資料的詮釋與分析,可以挖掘資料所隱含的訊息,預測未來的市場及產品的發展趨勢,降低經營不確定性的風險。

  本書是統計實務與大數據應用的入門書,共分為三大部分。

  第一部分共計三章,即第一章至第三章,為描述性統計的介紹,可使學生及實務工作者瞭解大多數企業及機構,常用的描述性統計分析。包括:資料尺度、資料型態、常用統計圖形及資料初步分析。

  第二部分共計四章,即第四章至第七章,為統計推論基本概念及常用基礎統計分析,以作為大數據分析之基礎。包括:機率理論、條件機率、常態分配及簡易的無母數統計方法、統計估計、研究假設及檢定、相關分析及迴歸分析。

  相關分析探討兩變數之間的線性關聯性。若為正相關,表示一個變數上升(或下降),另一個變數也會上升(或下降);若為負相關,表示一個變數上升(或下降),另一個變數也會下降( 或上升)。迴歸分析探討一個或多個自變數,對一個目標變數正向或反向的影響關係。

  第三部分共計六章,即第七章至第十二章,為常用的大數據分析概念及技術。包括:大數據概述、大數據「分類」模型之決策樹(Decision Trees)、羅吉斯迴歸(Logistic Regressions)及貝氏機率分類法(Bayes Probability Classification)。大數據「分群」模型之叢集分析(Cluster Analysis)及類神經網路(Neural Network)。大數據「關聯與預測」模型分析之關聯規則(Association Rule)及時間序列(Time Series)。最後,第十二章為進階統計實務之發展,探討統計資訊的演進、統計深度學習、統計機器學習及人工智慧。

本書特色

  本書之特點有三:
  1 本書兼顧實務描述性資料分析、基本統計實務分析及常用大數據分析技術。
  2 本書為使內容易於閱讀、理解及教學,故儘量以圖表、案例及數學公式詳細分項說明。
  3 本書所有實作範例(包含大數據分析技術),皆以EXCEL 軟體之函數及公式為之,以達到易學易用之效。

  本書初衷是期望將統計實務及大數據分析,進行有系統的分析與整理,俾有助於大學生、研究生及管理實務工作者,釐清觀念並增進應用知識。然鑒於本書撰寫之時,全球許多政府、企業及研究機構,刻正進行大數據理論及實務應用之更新及發展。因所學有限,全書內容或有掛一漏萬、文字不當之處,冀祈各界先進不吝賜教,是所至盼。


目錄大綱


第1章 統計實務概論
1-1 統計實務的意義
1-2 數據資料的尺度與型態
1-3 數據資料來源
1-4 統計實務的分類

第2章 常用統計圖形
2-1 資料的量測尺度
2-2 檢視資料的分布—如何以統計圖表呈現

第3章 資料初步分析
3-1 資料總體描述
3-2 單變數的集中程度之衡量
3.3 單變數分散程度之衡量
3-4 單變數分布形狀之衡量
3-5 兩變數之間關係之衡量
3-6 兩變數線性關係衡量

第4章 機率與統計
4-1 為何需要懂機率及統計
4-2 機率理論
4-3 條件機率
4-4 機率分配
4-5 常態分配
4-6 中央極限定理
4-7 無母數統計

第5章 估 計
5-1 估計方法
5-2 母體平均數
5-3 母體變異數
5-4 母體比例

第6章 研究假設及檢定
6-1 假設檢定的本質與邏輯
6-2 統計顯著性差異
6-3 統計檢定程序
6-4 檢定的種類

第7章 相關與迴歸分析
7-1 相關分析
7-2 簡單線性迴歸
7-3 多元線性迴歸

第8章 大數據導引
8-1 大數據定義與概述
8-2 大數據應用
8-3 大數據分析方法

第9章 大數據分析— 分類模型
9-1 決策樹
9-2 羅吉斯迴歸
9-3 貝氏機率分類

第10章 大數據分析— 分群模型
10-1 集群分析
10-2 類神經網路

第11章 大數據分析— 關聯與預測模型
11-1 關聯規則
11-2 時間序列

第12章 進階統計實務
12-1 統計資訊的演進
12-2 統計深度學習
12-3 統計機器學習
12-4 人工智慧
 
第13章 系統安裝與移除
13-1 SQL Server 安裝程序
13-2 資料採礦增益集安裝程序
13-3 SQL Server 移除程序
13-4 系統檢查

附表


作者介紹


古永嘉
現職
 
國立臺北大學 企業管理學系教授
學歷
 
美國德州大學阿靈頓分校企管博士
經歷
 
台灣期貨交易所董事
經濟部商業司 SIIR 服務業創新研發召集委員
青年創業總會經營管理主任委員
商業總會經貿諮詢委員
國營事業經營績效審議委員
多家上市櫃公司董事或監察人
上市及上櫃審議委員
楊志清
學歷
 
國立政治大學統計學博士
經歷
 
中華創新資訊與應用統計學會祕書長
中華市場研究協會 祕書長
淡江大學兼任助理教授
中國文化大學兼任助理教授




相關書籍

MATLAB 電磁場與微波技術模擬

作者 梅中磊 李月娥 馬阿寧

2020-03-20

Mathematics and Programming for Machine Learning with R: From the Ground Up

作者 Claster William B.

2020-03-20

Python Unit Test Automation: Automate, Organize, and Execute Unit Tests in Python

作者 Pajankar Ashwin

2020-03-20







2
2
2