Statistics for Managers: Using Microsoft Excel

課本P.38翻譯

貿二A 徐晣彧

用類型分類變數

 

在替資料選擇適當的統計方法時,必須先知了解資料的變數是什麼類型。一般來說,變量可分為數值變量類別變量兩種,數值變量的資料是一個被運算或者是被測量的量,而類別資料則是用來分作種類。舉例來說,“性別”,就有男生和女生的類別變數。而在範例1.1中的銷售量,就是一個數值變量,因為當中牽涉到了“數量”這件事。

 

在某些統計方法中,你必須更進一步地將數值資料劃分為離散的數值變數或是連續的數值變數。離散數值變數代表“某東西的數子”,像是月份的數字,或是在店裡出售的智慧型手機。連續數值變數則有從測量中所取得的數字。“排隊所花費的時間”就是一個連續數值變數,因為它代表一個時間測量。連續變數的資料可能事一個連續或一個間隔的值,取決於測量工具的準確性。舉例來說,等待的時間可以是1分鐘,1.1分鐘, 1.11分鐘,或是 1.113,取決於計時工具的精確程度。

 

對於某些資料,你可能會定義數值變數給一個問題但定義類別變數給其他問題。舉例來說,一個人的年紀似乎是數值變數,但是如我你想了解的事不同年齡層的購買習慣,小孩、年經人、成年人、中年人、退休的人等等,在這樣的情況下,用類別變數,就更切合主題。

 

測量尺度(Measurement Scales)

 

當定義一個變數時,我們辨別他的測量尺度。測量尺度定義變數的次序並且決定一對不同變數是否可以用其中一個來表達另外一個。表1.1為測量尺度的範例,有些在其他的部分就有被使用到。

 

數值變數用等距尺度或是比率尺度來定義。等距尺度用來表達兩兩間的補同,而沒有原點。比率尺度則包含了原點。如果一個數值變數有比率尺度,你可以用其中一個來描述另一個的特徵。舉例來說,你可以說一個東西的價格是兩美元(比率),是一元商品的兩倍貴。但是,華氏溫度是等距尺度,2度就不能代表是1度的兩倍熱。對於不論等距尺度或是比率尺度來說,一單位的差距都是一樣的,舉例還說華氏11度和華氏10度的差距,跟華氏1度與2度的差距都是一樣的(比率尺度的錢也是一樣的 1元和2元的差距與3元和4元的差距是一樣的)。

類別變數用提供較少變數值資訊的測量尺度。對於用名義尺度測量的資料,類別值就沒有次序或排名。對於次序尺度測量的資料,就有次序或排名。次序尺度提供兩兩間的比較,但較少於等距尺度或比率尺度的資訊。舉例還說,次序尺度“差”、“普通”、“好”、“極品”讓你知道“好”是比“差”與“普通”優但不比“極好”,但不同於等距或比率尺度,你無法暸解他們互相是差多少。

 

貿二A 05154152 徐晣彧 譯

 

老師上課筆記

 

最後,老師影片三個圖的課本重點摘錄

 

課本重點摘錄

舊版p92莖葉圖     The Stem-and-Leaf Display

 

莖葉圖透過將資料用行列的方式排列視覺化呈現。每個“根”的右邊會有一至多片葉,左邊的根和右邊的葉合起來就是值。莖葉圖讓人看出數值怎麼分配,數值比較集中存在在哪個根的那一列。莖葉圖的“葉”通常代表比較不具影響力,較小的位數。

 

舊版p93     長方圖 The Histogram與多邊圖Polygram

 

長方圖透過代表分類間隔的垂直長條圖表來視覺化資料。在長方圖中,x軸呈現數值變數,而y軸則呈現出現頻率或百分比。長方圖每個間隔的“中點”連線為多邊圖,多邊圖又分為百分比與累積百分比兩種。百分比的呈現會讓你直接了解每個間隔區間直接的百分比,而累積百分比則會讓你看到由左而右逐漸累積的情況,到了最右邊就會是百分之百。

 

 

舊版p158    盒鬚圖Boxplot

 

盒鬚將“五數概括法”視覺化,這個五數代表最小值、第一四分位數Q1、中位數Q2、第三四分位數Q3、以及最大值。每個區間為百分之二十五,而那個區間中所佔資料中的比例,就會影響其長度分佈。

Statistics for Managers: Using Microsoft Excel 課本P.38翻譯與課程筆記與預習重點摘錄
>>將內容用自己的手機、平版分享到.....