統計簡史
【現代統計學的發展】戴久永
統計的起源可追溯至十八世紀甚至更早,然而統計學主要的發展卻遲至十九世紀末葉二十世紀初期才真正開始。到了四十年代才逐漸成熟,統計學和機率論的關係異常密切,事實上任何統計問題的研究都必須牽涉到機率論的運用,因為後者實為前者的主要工具。…………《 重點節錄 》
【自然與社會的交集–統計學的歷史】,王秀雲,美國威斯康辛大學科學史博士
對於統計數字的迷戀,是過去三百年逐漸培養出來的。而這段歷史,與十七、十八世紀發生在歐洲的科學革命所建立的世界觀,有密切的關係。在這個包含許多思想轉變的世界觀中,實證態度與對自然法則的信仰,對統計學的發展特別有影響。
…………《 重點節錄 》
【維基百科 – 統計學】
統計手法最早可以追溯至公元前5世紀。最早的統計著作來自公元9世紀的《密碼破譯》(Manuscript on Deciphering Cryptographic Messages)一書,由阿拉伯人肯迪編著。在書中,肯迪詳細記錄了如何使用統計資料和頻率分析進行密碼破譯。根據沙烏地阿拉伯工程師易卜拉欣·阿凱笛(Ibrahim Al-Kadi)的說法,統計學和密碼學分析便如此一同誕生了。…………《 重點節錄 》
【MBA智库百科 – 統計學】
統計學的英文statistics最早是源於現代拉丁文statisticum collegium (國會)以及義大利文 statista (國民或政治家)。 德文Statistik,最早是由Gottfried Achenwall(1749)所使用,代表對國家的資料進行分析的學問,也就是“研究國家的科學”。在十九世紀統計學在廣泛的數據以及資料中探究其意義,並且由John Sinclair引進到英語世界。…………《 重點節錄 》
學習統計的必要性
無論統計學科應用在那個領域,學習統計代表的就是學習「對於數字的識讀能力」,其包含對於解讀數字的「專業見解」與對於看穿隱含意義的「素養能力」。如果具備了統計的「專業能力」,但是沒有意識到「素養能力」的培養,〝統計”很容易淪為只是一堆數字的整理與表淺的解釋,也很容易只看到專業的統計報表與說明,但是判斷不出專業數據背後的機會,或是矛盾,嚴重者利用統計數字做決策依據,其錯誤的決策比做錯事更嚴重。
如何學習統計的「專業能力」與「素養能力」?
「專業能力」就是一般在課堂上的統計學習,要學習的是如何將〝數據〞正確描述的資訊表達,裡面包含正確的方法使用與背後支持的理論基礎。能力的學習有兩個重點提供參考建議:(1)正確的應用;(2)更多領域的了解。正確的應用就是當要分析或是解讀「數據」時,可以選擇正確的統計計算,將數據正確的呈現出來;更多領域的了解就是要持續學習統計不同情境的應用與更進階的專業學習,可以協助提升用最合適的方式來詮釋「數據」更多的資訊內容。
「素養能力」的學習則是要持續不斷,能力的提升可以來自以下的建議方式:(1)模仿中學習,利用看專業文章報導的機會,了解別人如何將「數據」做呈現、描述、解析與判讀;(2)訓練自己異位思考,看同一組「數據」,有沒有別人還沒看的資訊?或是嘗試挑戰有沒有誤用統計計算或判讀的誤謬?甚至懷疑「數據」的來源與應用的錯誤?(3)開放性的態度,任何有利或是不利的統計資訊,是否能夠客觀的來看待數據所要告訴我們的「事實」,從中找出對於我們有利的決策判斷或是解決方案。「素養能力」的養成並非一蹴可幾看書本就可以學會,必須自己動過腦、思考過後有自己的定見,自己的想法會隨著閱歷愈廣、知識學習愈多,會愈來愈〝熟稔”與〝準確”,這就是能力的養成過程,所以在學習「專業能力」的過程中,是可以同步培養「素養能力」的提升,訓練自己多閱讀(增加廣度)、多思考(訓練深度)、多表達(透過說、寫等方式加強敏感度)。
另外,可以從三個不同的角度來看學習統計的必要性與重要性:
1.從政府的必要
2.從企業的觀點
3.從個人的角度
→ 「學習統計的必要性」
滿足社會科學的「統計劇本」
描述統計學
描述統計學(descriptive statistics)又稱敘述統計學,是將觀察量的資料統計分析後,用數據、圖表或是模式呈現出來。透過圖表形式對所收集的數據進行加工處理和顯示,比較容易傳達我們想要呈現的資訊結果,進而達到現象解釋、溝通討論、決策分析等的用途。
圖示化呈現
將資料轉換為圖表方式呈現,以直觀瞭解整體資料分佈的情況。通常會使用的工具是頻率分佈表 (frequency distribution table)與圖示法,如多邊圖(polygon)、直方圖(histogram, bar chart)、圓形圖(pie chart)、散點圖(scatter plot)等。
展現資料特質
了解所收集觀察值集中與分散的程度況狀。常用的觀測計算方式有:
●了解整體數據的集中量數(measure of central location)~
平均數(Mean)、中位數(Median, Md)、眾數(Mode, Mo)、幾何平均數(Geometric mean, GM)、調和平均數(Harmonic mean, HM)等。
●了解變異量數(measure of variation)~
全距(range)、平均差(average deviation, AD)、標準差(standard deviation, SD)、相對差、四分差(quartile deviation)等。
推論統計學
推論統計學(或稱統計推論,inferential statistics)研究如何根據樣本數據去推斷總體數量特徵的方法。它是在對樣本數據進行描述的基礎上,對統計總體的未知數量特徵做出以機率形式表述的推斷。
推論統計學依照母體條件的差異性又可分為“有參數統計學”(Parametric Statistics)和“無參數統計學”(Non-Parametric Statistics)。其中有參數統計學是指母體呈常態分配(Normal Distridbution)的統計推論方法;其他所有應用於非常態分配母體的統計推論方法,都稱為無參數統計學。有參數統計學比無參數統計學發展得早,其經典課題有“點估計”、“區間估計”與“假設檢驗”等。
數理統計學
數理統計學(Mathematical Statistics)是統計學的數學基礎,從數學的角度去研究統計學;數理統計學是以機率論為基礎,研究社會和自然界中大量隨機現象數量變化基本規律的一種方法。其主要內容有參數估計、假設檢驗、相關分析、試驗設計、非參數統計、過程統計等。用數理統計方法去解決一個實際問題時,一般有如下幾個步驟:建立數學模型 → 確定數據的收集方式 → 安排特定實驗以收集數據 → 數據整理 → 統計推論 → 預測判斷 → 進行決策。這些環節不能截然分開,也不一定按上述次序,有時是互相交錯的。
數理統計學的發展領域
統計學所關切的領域很廣,所以數理統計學研究的內容學科分類很多,很難有個明確的分類方式,不過大致上可以概略劃分為以下三類:
1.抽樣調查和試驗設計。主要討論在觀測和實驗數據的收集中有關的理論和方法問題。
2.統計推論的原理和方法。主要研究議題有~
①特定的統計推論形式,如參數估計和假設檢驗。
②特定的統計觀點,如貝葉斯統計與統計決策理論。
③特定的理論模型或樣本結構,如無母數統計、多元統計分析、回歸分析、相關分析、序貫分析,時間序列分析和隨機過程統計等等。
3.針對一些特殊的應用問題而發展起來的研究領域,如產品抽樣檢驗、可靠性統計、統計質量管理等。