你的投資顧問向你提出一個月收入投資計劃,承諾每個月都有一個可變的回報。只有保證每月平均收入180美元,你才會投資它。你的顧問還告訴你,在過去的300個月裡,這個計劃的平均投資回報為190美元,標準差為75美元。你應該投資這個計劃嗎?假設檢驗有助於此類決策。
假設或顯著性檢驗是一種數學模型,用於使用樣本集中測量的資料,檢驗給定總體集中有關引數的主張、想法或假設。對選定的樣本進行計算,以收集有關整個人口特徵的更具決定性的資訊,從而能夠系統地測試有關整個資料集的主張或想法。
這裡有一個簡單的例子:一位校長報告說,他們學校的學生在考試中平均得7分。為了驗證這個“假設”,我們記錄了學校全體學生(比如300人)中30名學生(樣本)的分數,並計算樣本的平均值。然後,我們可以比較(計算的)樣本平均數和(報告的)總體平均數,並嘗試確認假設。
再舉一個例子,某個共同基金的年回報率是8%。假設共同基金已經存在了20年。我們隨機抽取共同基金五年(樣本)的年回報率,並計算其平均值。然後我們比較(計算的)樣本平均數和(聲稱的)總體平均數來驗證假設。
本文假設讀者熟悉正態分佈表的概念、公式、p值和相關的統計學基礎。
假設檢驗有不同的方法,但涉及相同的四個基本步驟:
通常情況下,報告值(或索賠統計)作為假設陳述並假定為真。對於上述例子,假設為:
上述描述構成了“無效假設(H0)”,並被假定為真實的——在法庭上出示的證據證明被告有罪之前,陪審團審判中的被告被推定無罪。類似地,假設檢驗從陳述和假設一個“零假設”開始,然後這個過程確定這個假設是真是假。
需要註意的重要一點是,我們正在測試無效假設,因為它的有效性存在懷疑因素。任何與所述無效假設相反的資訊都會在替代假設(H1)中捕獲。對於上述例子,另一種假設是:
換言之,替代性假設是與無效假設的直接矛盾。
在審判中,陪審團假定被告無罪(無效假設)。檢察官必須證明另一種情況(另一種假設)。同樣地,研究者必須證明無效假設是真是假。如果檢察官未能證明替代假設,陪審團必須讓被告離開(基於無效假設的決定)。同樣地,如果研究者未能證明另一種假設(或只是什麼也不做),那麼假設無效假設為真。
決策標準必須基於資料集的某些引數。
決策標準必須基於資料集的某些引數,這就是正態分佈的聯絡所在。
根據抽樣分佈的標準統計假設,“對於任意樣本量n,X的抽樣分佈̅ 如果抽取樣本的總體X是正態分佈的,則為正態分佈。”因此,所有其他可能樣本的概率意味著人們可以選擇正態分佈。
例如,確定在XYZ股票市場上市的任何股票在元旦前後的平均日回報率是否大於2%。
H0:無效假設:平均值=2%
H1:替代假設:均值>;2%(這是我們要證明的)
取樣本(比如500只股票中的50只),計算樣本的平均值。
對於正態分佈,95%的值位於總體平均值的兩個標準差之內。因此,樣本資料集的正態分佈和中心極限假設允許我們建立5%作為顯著性水平。這是有道理的,因為在這種假設下,得到超出總體平均值兩個標準差的異常值的概率不到5%(100-95)。根據資料集的性質,其他顯著性水平可以取1%、5%或10%。對於金融計算(包括行為金融學),5%是公認的限額。如果我們發現任何計算超出了通常的兩個標準差,那麼我們就有一個很強的異常情況來拒絕零假設。
用圖形表示如下:
在上面的例子中,如果樣本的平均值遠遠大於2%(比如說3.5%),那麼我們拒絕了無效假設。另一種假設(平均值>2%)被接受,這證實了股票的平均日回報率確實在2%以上。
然而,如果樣本的平均值不太可能顯著大於2%(並且保持在,比方說,2.2%左右),那麼我們不能拒絕無效假設。如何對如此近距離的案件作出裁決是一個挑戰。為了從選定的樣本和結果中得出結論,需要確定一個顯著性水平,從而能夠得出關於無效假設的結論。另一種假設能夠確定重要程度或“臨界值”概念,以決定此類近距離案件。
根據教科書中的標準定義,“臨界值是一個臨界值,它定義了一個界限,如果零假設成立,超過這個界限可以得到少於5%的樣本均值。樣本意味著超過臨界值將導致拒絕無效假設的決定。” 在上面的例子中,如果我們將臨界值定義為2.1%,並且計算的平均值達到2.2%,那麼我們拒絕了無效假設。臨界值確定了接受或拒絕的明確界限。
這一步包括計算所選樣本所需的數字,稱為測試統計資料(如平均值、z分數、p值等)(我們將在後面的部分中討論這些。)
根據計算出的值,確定零假設。如果得到樣本均值的概率小於5%,則結論是拒絕無效假設。否則,接受並保留無效假設。
在基於樣本的決策中,關於對整個人群的正確適用性,可能有四種結果:
...個概念以及它們之間的區別,因為正規化和理論是所有科學中的重要概念,而且我們經常聽到它們的使用。正規化與理論是兩個不同的概念,但又是相互聯絡的,一個單一的正規化可以包含多個理論,並以正規化為參照,幫助學...
什麼是雙尾檢驗(a two-tailed test)? 在統計學中,雙尾檢驗是一種方法,在這種方法中,分佈的臨介面積是雙邊的,檢驗一個樣本是否大於或小於某一範圍的值。它用於零假設檢驗和統計顯著性檢驗。如果被測試的樣本落入任何一...
...範圍。t檢驗的問題是,兩組之間的差異是否代表了研究中的真實差異,或者是否可能是無意義的隨機差異。 t分佈表 T分佈表有單尾和雙尾兩種格式。前者用於評估具有明確方向(正或負)的固定值或範圍的案例。例如,當擲...
...遵循一個數學模型,它們有時可以是存在的陳述。 有用的假設通常能夠透過推理進行預測,並且可以預測自然現象或實驗的結果。在每一個假設中,研究者必須知道結果,才能證明假設的真實性。 假設並不總是正確的,一個命...
...是一種理論的一部分,也可能成為一種理論。有幾種型別的假設: *歸納和演繹假說。歸納假設是建立在一般觀察的基礎上,而演繹假設是建立在理論的基礎上,或者支援、擴充套件或者反駁理論。*定向和非定向假設。方向性假...
...於理性的邏輯分析來運作的。科學是不同的,因為它使用的假設檢驗是基於經驗的。這種過程上的差異使兩者能夠相互依賴地工作,從而相互更新各自的進展。 哲學改進、拋棄或反對某些概念或哲學立場,例如當代概念(即功...
...。然而,歸納推理的另一個值得註意的方面是,即使陳述中的前提是真的,也允許結論是假的。例如,禿頭並不一定意味著所有禿頭的人都是祖父,這一結論在歸納推理中得到了認可。 總結 - 演繹法的主要區別(of major differences ...