Tag Archive for statistics

Estimating Proportions with Confidence

以下作業-可以書寫在Word或Excel,但交到平台都要截圖, 掃瞄或是pdf檔。

1.忘了,記得3/10筆記上網!
1457769899367145776992821114577699585401457770002873145777003879914577700877561457770115994145777014513114577701725141457770199919
2.page 403, 10.12

1457770430635

3.page 405, 10.28

1457770476165

4.上述兩題以PHStat4軟體做一次。

10.1210.28

5. page 407, 10.58

1457770512541

6.全文翻譯p.416 Example 11.1

寵物與壓力

很多研究使用相依與獨立樣本的組合。獨立樣本用來比較群體或處理情形,相依樣本計用來測量兩者群體中每個人變動率的變化。

舉例來說,假設研究員想知道獨居的年長者養寵物是否能降低血壓。他們可以設計實驗:召募一些想參與實驗的自願者。隨機分配寵物給一半的受試者,另一半則當控制組。實驗開始時先測量所有自願者最初的血壓。然後六個月再次測量。資料比率為血壓的變化。

每個人血壓的變化就是相依差距(最初的血壓-最後的血壓)。像這樣蒐集資料方法就是一個用第一種方法(p.415″同樣的測量每人做兩次,在不同情況或時間下”)取得相依資料的例子。在這個例子中,血壓在兩種情況下進行測量:實驗一開始時,和養寵物的六個月後。

兩個群體血壓的變化,那些有寵物和沒有寵物的控制組構成了獨立樣本。如此收集資料的方法為第三種取得獨立樣本的方法”參與者被隨機指定兩者中其中一種情況,同樣的應變數也會隨單位記錄”。在這例子中,這兩種情況為寵物的有無,應變數則為實驗前後的測量。

參數比率為 Md= 獨居年長者擁有寵物母體平均血壓變化

M1-M2=母體中獨居年長者血壓平均變化不同,有寵物與沒有的比較

7.page 449, 11.6

1458117923221

8.參考 Example 11.1,解page 453, 11.46 a與b。

1458139838183

>>將內容用自己的手機、平版分享到.....

Week 2 hw

1. note
20160306_22270020160306_22270320160306_22272120160306_222710

2.全文翻譯p.378上面3個黑點

如果你受過敏困擾,你可能會想你有幾家公司。我們希望估計的參數為p=母體中受過敏困擾的比例。這參數在範例10.2中估計。

如果你贏了樂透,你會繼續工作嗎?其他人會怎麼做?一個比例參數p=工作中的成年人如果贏了樂透,說會辭掉工作的比例。這參數在範例10.6中估計。

女人和男人的說法是否一致,當與一個性格極好的人約會,會不看外貌?為了調查,我們可能要估計參數p=p1-p2=母體中對問題「你是否會與一個個性很好,但對你完全沒有吸引力的人約會?」回答是的女性與男性的比例差異程度。這參數在範例10.3中估計。

3.全文翻譯p.379 Example 10.1上面2段

將信賴區間作估計區間的概念

記得點分析有時候會用來當作樣本統計量(樣本估計值)的同義字synonym。這是因為在數線上,他是一個單一的數字或點。相反的,估計區間則是信賴區間的同義詞。儘管是一段區間的值,估計區間估計的是單一固定的母體的值。

一個信賴區間總會伴隨著一段信心水準,它告訴我們估計區間包含實際參數值的可能性有多高。最常用在研究和媒體的信心水準為95%。在這章節之後,我們將學習如何從任一特定的信心水準找出適當的區間。

4.全文翻譯p.381-382 Example 10.2

1998年四月,聖母學院公眾輿論調查了883個隨機抽樣的美國成年人是否過敏。根據學院網站的報告,樣本中36%的人對於「你是否對任何東西過敏」回答是,所以樣本比例中,回答是的為p̂=0.36。我們用樣本資訊計算出95%信賴區間對母體參數p=美國成年人對某些東西過敏的比例的估計值。部分公式樣本統計量+-乘數*標準誤的值如下:
樣本統計量=p̂=0.36
乘數=2(為了達到95%信心水準)
標準誤=(p̂(1-p̂)/n)^1/2=(0.36(1-0.36)/883)^1/2=0.016
95%的信賴區間為0.36+-2*0.016等於0.36+-0.032或0.328 0.392(約33%到39%)
翻譯:信賴區間0.328到0.392估計出所有美國成年人有過敏的比例。用百分比表示為33%到39%。信心水準(95%)描述了我們對於用來估計區間的信心程度。長期來看,這程序有效占95%的次數,意指它會提供涵蓋真實母體比例值的區間。

5.回答10.24(仿課本詳細過程)

20160308_064719

 

6.回答10.54(仿課本詳細過程)

1457406614392

>>將內容用自己的手機、平版分享到.....

Week 2 pre

1.p.327 中間那3段

統計量的標準差與標準誤

標準差公式的樣本分配因五種不同情況而有所差異,但在各個情況中,受到樣本大小影響,當樣本數變大時會變小。換句話說,當樣本數變大,可能質的變化性縮小。

為了從σ(獨立測量母體的標準差)區別出樣本分配的標準差,我們必須先從理論中預選。我們先將統計量視為理論上的標準差的一部份。然後將標準差樣本分配的平均值稱x̄。樣本分配標準差之於樣本的比率稱為p̂的標準差,以此類推。現在單單只用「標準差」已不足以提供足夠的資訊。為了能清楚表達,在使用標準差的字眼時應該說明,如母體測量標準差或樣本平均之標準差。

當我們使用統計推論的結果時,通常需要樣本資料來估計樣本分配之標準差。為了表明這個值是估計的,我們稱之為標準誤。所以,平均值的標準誤或是x̄的標準誤皆用來說明x̄的標準差,至於用來測量p̂的標準差,我們稱之為p̂的標準誤。

2.p.332 下半頁3段含公式

從單一樣本比例估計母體比例

從9.4例子中,我們從投票中用來預測的可能值範圍:n=2400 p=0.4 在值計操作中,當我們真的在政治選舉中隨機抽樣2400位投票者,我們只有一個樣本比例,而且無法知道母體的比例。但是,我們知道樣本與實際母體的比例大概相去多遠。而這項訊息就在p̂的標準差裡: s.d.(p̂) = (p(1-p)/n)^1/2

這公式包含p(母體比例)。在很多情況中,我們並不知道p的值。相反的,我們用觀察到的樣本比例(p̂)去估計未知參數p的值。於是我們用公式中樣本值p̂來估計p̂的標準差。而這估計的結果稱為p̂的標準誤。

s.e.(p̂)=(p̂(1-p̂)/n)^1/2

舉例來說,如果p̂=0.39 n=2400 s.e.=(0.39(1-0.39)/2400)^1/2=0.

01神奇的是,藉由單一的樣本決定出來這個值,用來估計所有可能樣本分配之標準本比例相當好用。因為我們已經知道實際平均值(p的比率)可以幾乎確定在觀察值p̂三個標準差以內,我們幾乎可以確定p的範圍在p̂+-3(s.e.)=0.39+-3(0.01)=0.39+-0.03。所以現在我們知道,實際支持候選人的比例幾乎可以確定介於0.36和0.42間。而唯一我們為了得知所需要的數值為樣本比例p̂還有樣本數n。

3.p.338 Definition下面那一段
測量值的標準差和樣本平均數標準差

小心不要搞混原始母體的測量值σ和本平均數標準差σ/n^1/2。參數σ是用來測量獨立母體的變異數。至於σ/n^1/2則是用來測量在母體中從不同隨機抽樣的n的樣本平均變異數。

4.p.339 最後一段含公式
平均數的標準誤

在實際操作過程中,母體標準差σ鮮少是知道的,所以樣本標準差s則用來代替它,當在尋找平均數之樣本分配標準差。與之前的做樣本比例的程序一樣,當做代換時,我們稱結果為平均值的標準誤。這論述合理,因為標準誤能大約的測量出平均x̄有誤差,並當作估計母體平均μ
我們將平均數的標準誤以s.e.(x̄)表示,公式如下:
s.e.(x̄)=s/n^1/2
s是樣本中觀察值的標準誤

5.p.348 中間之後的2段,最後一段不用
學生t分配:將σ代換成s
當在計算標準化後的統計平均值,我們面臨一個難題:我們鮮少知道母體標準差,而它又包含在公式裡。例如標準化x̄的分母包含鮮少知道的母體標準差σ。最好的解決辦法是,求出σ的逼近值,用樣本標準差s,然後用s.e.(x̄)=s/n^1/2推出s.d.(x̄)=σ/n^1/2。不幸的是,當樣本數很小時,使用這種方法通常會偏離目標,所以標準化的統計量不會完全符合標準常態分配。相反的,在特定情況下,它有一種分配,稱為學生t分配或t分布。

學生t-分配恆常是鐘形的,並對稱於平均數0。這個分配完全取決於單一參數,我們稱之為自由度degree of freedom(df)。在大部分的應用中,這參數是用來當作樣本數的功能,但是特定的自由度公式取決於問題的類型。像標準化的樣本平均數x̄ df=n-1。t分布的特性之一為,當自由度增加時,分配會越趨近於標準常態分佈的曲線。當t分布的自由度趨近於無限時,它和標準常態分布是一模一樣的。在實際操作中,如果自由度非常大時,它和標準常態分布是可替換地。

6.預習課程平台3/3筆記(3/1晚上上傳)

>>將內容用自己的手機、平版分享到.....

week1

 

notes

12495258_1006673792744246_8529100340192562767_n 12742443_1006673729410919_7204148064484809524_n 12742824_1006673592744266_5278738092840934156_n 12744619_1006673749410917_4432049423884178064_n 12744627_1006673529410939_9074798142272226417_n 12744710_1006673696077589_1723402750529825040_n 12745772_1006673672744258_5852912121448167059_n 12791098_1006673646077594_2847187611127752343_n 12376791_1006673622744263_4832547964506731447_n

Chapter 9 Understanding Sampling Distributions: Statistics as Random Variables

9.1 Parameters, Statistics, and Statistical Inference

parameter 參數 : numerical summary of a population, value is fixed and unchanging

statistic or sample statistic 樣本統計量 : a numerical summary of a sample, value may be different for different samples

statistical inference 推論統計: 研究如何根據樣本數據去推斷總體數量特徵的方法。它是在對樣本數據進行描述的基礎上,對統計總體的未知數量特徵做出以機率形式表述的推斷。更概括地說,是在一段有限的時間內,通過對一個隨機過程的觀察來進行推斷的。The two most common procedures are to find confidence intervals and to conduct hypothesis tests.

confidence interval 信賴區間 :參數的真實值有一定機率落在測量結果的周圍的程度。信賴區間給出的是被測量參數的測量值的可信程度。這個機率被稱為信心水準。舉例來說,如果在一次大選中某人的支持率為55%,而信心水準0.95上的信賴區間是(50%,60%),那麼他的真實支持率有百分之九十五的機率落在百分之五十和百分之六十之間,因此他的真實支持率不足一半的可能性小於百分之2.5(假設分布是對稱的)。

hypothesis testing or significance testing 假設檢定 : 根據某些樣本,推論統計可以進行實驗的檢定某個假設 H1 是否可能,其方法是透過否定對立假設 H0,看看 H0 是否不太可能發生。

9.2 From Curiosity to Questions about Parameters

 

9.3 SD Module 0: An Overview of Sampling Distributions

9.4 SD Module 1: Sampling Distribution for One Sample Proportion

9.5 SD Module 2: Sampling Distribution for the Difference in Two Sample Proportions

9.6 SD Module 3: Sampling Distribution for One Sample Mean

9.7 SD Module 4: Sampling Distribution for the Sample Mean of Paired Differences

9.8 SD Module 5: Sampling Distribution for the Difference in Two Sample Means

9.9 Preparing for Statistical Inference: Standard Statistics 

9.10 Generalizations beyond the Big Five

>>將內容用自己的手機、平版分享到.....

Final Week

>>將內容用自己的手機、平版分享到.....

HW14

Image_77b2496

>>將內容用自己的手機、平版分享到.....

HW13

Week-13-HW1

>>將內容用自己的手機、平版分享到.....

HW12

11

12

13

14

>>將內容用自己的手機、平版分享到.....

HW11

randomized experiment: participants are randomly assigned to participate in one condition or another.

subjects: when the experimental units are people, they often called subject.
confounding variables: both affect the response variable and also is related to experimentory subject.
lurking variable: sometimes used to describe a potential confounding variable that is not measured and is not considered in the interpretation of a study.

double blind: experiment is one in which neither the participant nor reasearcher knows the treatment.

single blind: the participants don’t know which treatment they have been assigned.

randomized block designs: experimental units are first divided into homogeneous groups called blocks, and each treatment is randomly assigned to one or more unit within each block.

repeated measures: each experimental unit are recives all treatments,ideally in a random order.

matched-pair designs: is an experimental design in which individuals are first matched on important characteristics.

between subject design: a way of avoiding the carryover effects that can plague within subject design.

Hawthorne effect: participants in an experiment respond differently than they otherwise would.

experimenter effects: experimenters bias the participants.

2.期中考作業團體作業修正
team report e2

 

3.reliability與效度validity的意義
信度是指可靠性或一致性。信度好的指標在同樣或類似的條件下重複操作,可以得到一致或穩定的結果。
信度有三種:
 穩定信度(stability reliability):這是一種長期的信度。也就是指標在不同時間做測量時,可以得到同樣的結果。通常我們是用測試與再測試方法(test-retest method)來檢視一個指標的穩定信度,也就是將同樣的指標對同一群體重新施測,如果每次都得到同樣的結果,則此指標即有穩定信度。
 代表性信度(representative reliability):代表性信度是橫跨各個次母體或群組的信度。也就是指標用於不同次母體或群組(如年齡、性別)時,可以得到同樣的結果。例如,對年齡的測量,應該是詢問不同年齡層時,都可得到一致性的資訊,不論此指標是正確的問到年齡,還是有同樣方向的偏誤,如以多報少。做次母群體分析(subpopulation analysis)時,除了比較指標使用在不同的次母群體或群組的結果外,還涉及利用其他獨立的資訊,以判斷指標使用在不同群組時所得到的結果是否有同樣的誤差。
 同等信度(equivalence reliability):同等信度是應用在利用多重指標測量同一構念的情況。我們感興趣的是:是否不同指標能得到一致的測量結果?
研究者常用折半法(the split-half method)來做此種信度的分析。其作法是將測量同一構念的多重指標隨機分成兩組後進行測量,然後判定是否兩組指標得到相同的結果。我們可以用如Cronbach’s α這種統計方法來做此種信度分析。如果多重指標有相當的信度,我們就可利用這些指標來建構量表。
另一種同等信度的特殊分析方法是做編碼者間信度(intercoder reliability)的分析。當我們用多位觀察者、評判者或編碼者時就可用此方法。其目的是檢視不同的觀察者或編碼者是否彼此間的意見一致。

如何增進信度
 明確的概念化:當我們只測量單一構念或構念的一個面向(subdimension),並有清楚的理論定義時,信度就會增加。
 提升測量尺度的精確性
 使用多重指標:多重指標能使研究者測量一個構念的廣泛定義內容。這就好像是從概念領域中做抽樣(sampling from the conceptual domain),使研究者能測量到一個構念的不同層面。
 使用預試(pretests)、前導研究(pilot studies)及重複測試(replication)

效度是指概念定義(conceptual definition)及操作化定義(operational definition)間是否契合。因此,當我們說一個指標有效度時,我們是在特定目的及定義的情況下做此判斷。同樣的指標在不同的研究目的下,可能有不同的效度。
測量的效度比信度難達到。因為構念是抽象的,而指標則是具體的觀察。我們對於一個測量是否有效度並無絕對的信心,但可判斷是否比另一測量更有效度。測量的效度有四種類型:
 表面效度(face validity):這是最容易達成及最基本的效度。此類效度就是由學界來判斷指標是否真的測量到所欲測量到的構念。
 內容效度(content validity):這是一種特殊的表面效度。此類效度關心的是:是否一個定義的內容都在測量中呈現出來?構念定義包含著想法與概念的「空間」,指標測量應該抽樣到或包含到此空間中所有的想法。內容效度的達成有三個步驟:
─ 說明構念定義的內容
─ 從此定義所包含的區域或部份中做抽樣
─ 發展指標將定義來連結定義的這些部份

 校標效度(criterion validity):此類效度是用某些標準或校標來精確的指明一個構念。檢視測量指標的這種效度是要將它與測量同一構念且研究者有信心的指標來做比較。這種效度有兩個次類型:
─ 併行效度(concurrent validity):一個指標必須與既存且已被視為有效的指標相關連。
─ 預測效度(predictive validity):一個指標能預測在邏輯上與構念相關的事件。此指標與預測的事件是指向同一構念,但又有區別。這和假設測定不同。假設測定是一個變項預測另一不同的變項。

 建構效度(construct validity):建構效度(或構念效度)是用於多重指標的測量情況。此類效度也有兩個次類型:
─ 聚合效度(convergent validity):當測量同一構念的多重指標彼此間聚合或有關連時,就有此種效度存在。
─ 區別效度(discriminant validity):此種效度也稱之為分歧效度(divergent validity),與聚合效度相反。此類效度是指當一個構念的多重指標相聚合或呼應時,則這個構念的多重指標也應與其相對立之構念的測量指標有負向相關。例如與「政治容忍」相關的多重指標應會與「政治不容忍」相關的多重指標間有負向相關。

>>將內容用自己的手機、平版分享到.....

HW10

(1)針對一個事件報導,我想要探討三家報社中國時報、聯合報與自由時報,哪一家比較公正客觀,該如何進行這項研究或實驗?
一、 找10則新聞:關於政治、經濟等議題。
二、各個縣市抽100人。
三、作問卷,問他們覺得上述陳述句最客觀,報紙順序隨機、匿名。
四、統計結果。
五、決定是聯合報。

(2)我想研究三瓶綠茶(市面上販售瓶裝水): 開心綠茶、茶裏王與原萃日式哪家公司比較回甘,該如何進行?
一、找100名品茶家,和100位有喝茶習慣的人。
二、請他們喝茶、隨機順序、獨自訪問。
三、統計結果。
四、決定都不回甘。

>>將內容用自己的手機、平版分享到.....