金融學中的假設檢驗：概念與例項

你的投資顧問向你提出一個月收入投資計劃，承諾每個月都有一個可變的回報。只有保證每月平均收入180美元，你才會投資它。你的顧問還告訴你，在過去的300個月裡，這個計劃的平均投資回報為190美元，標準差為75美元。你應該投資這個計劃嗎？假設檢驗有助於此類決策。...

你的投資顧問向你提出一個月收入投資計劃，承諾每個月都有一個可變的回報。只有保證每月平均收入180美元，你才會投資它。你的顧問還告訴你，在過去的300個月裡，這個計劃的平均投資回報為190美元，標準差為75美元。你應該投資這個計劃嗎？假設檢驗有助於此類決策。

關鍵要點

假設檢驗是一種數學工具，用於確認財務或商業主張或想法。
假設檢驗有助於投資者決定投資什麼以及該工具是否可能提供令人滿意的回報。
儘管存在不同的假設檢驗方法，但使用的是相同的四個步驟：定義假設、設定標準、計算統計資料和得出結論。
與大多數統計工具和模型一樣，這種數學模型也有侷限性，並且容易出現某些錯誤，因此投資者也有必要結合這種模型考慮其他模型

什麼是假設檢驗(hypothesis testing)？

假設或顯著性檢驗是一種數學模型，用於使用樣本集中測量的資料，檢驗給定總體集中有關引數的主張、想法或假設。對選定的樣本進行計算，以收集有關整個人口特徵的更具決定性的資訊，從而能夠系統地測試有關整個資料集的主張或想法。

這裡有一個簡單的例子：一位校長報告說，他們學校的學生在考試中平均得7分。為了驗證這個“假設”，我們記錄了學校全體學生（比如300人）中30名學生（樣本）的分數，並計算樣本的平均值。然後，我們可以比較（計算的）樣本平均數和（報告的）總體平均數，並嘗試確認假設。

再舉一個例子，某個共同基金的年回報率是8%。假設共同基金已經存在了20年。我們隨機抽取共同基金五年（樣本）的年回報率，並計算其平均值。然後我們比較（計算的）樣本平均數和（聲稱的）總體平均數來驗證假設。

本文假設讀者熟悉正態分佈表的概念、公式、p值和相關的統計學基礎。

假設檢驗有不同的方法，但涉及相同的四個基本步驟：

第一步：定義假設

通常情況下，報告值（或索賠統計）作為假設陳述並假定為真。對於上述例子，假設為：

這所學校的學生考試平均得7分。
例B：共同基金的年回報率為8%。

上述描述構成了“無效假設（H0）”，並被假定為真實的——在法庭上出示的證據證明被告有罪之前，陪審團審判中的被告被推定無罪。類似地，假設檢驗從陳述和假設一個“零假設”開始，然後這個過程確定這個假設是真是假。

需要註意的重要一點是，我們正在測試無效假設，因為它的有效性存在懷疑因素。任何與所述無效假設相反的資訊都會在替代假設（H1）中捕獲。對於上述例子，另一種假設是：

學生的平均分不等於7分。
共同基金的年回報率不等於每年8%。

換言之，替代性假設是與無效假設的直接矛盾。

在審判中，陪審團假定被告無罪（無效假設）。檢察官必須證明另一種情況（另一種假設）。同樣地，研究者必須證明無效假設是真是假。如果檢察官未能證明替代假設，陪審團必須讓被告離開（基於無效假設的決定）。同樣地，如果研究者未能證明另一種假設（或只是什麼也不做），那麼假設無效假設為真。

決策標準必須基於資料集的某些引數。

第二步：設定標準

決策標準必須基於資料集的某些引數，這就是正態分佈的聯絡所在。

根據抽樣分佈的標準統計假設，“對於任意樣本量n，X的抽樣分佈̅ 如果抽取樣本的總體X是正態分佈的，則為正態分佈。”因此，所有其他可能樣本的概率意味著人們可以選擇正態分佈。

例如，確定在XYZ股票市場上市的任何股票在元旦前後的平均日回報率是否大於2%。

H0：無效假設：平均值=2%

H1：替代假設：均值&gt；2%（這是我們要證明的）

取樣本（比如500只股票中的50只），計算樣本的平均值。

對於正態分佈，95%的值位於總體平均值的兩個標準差之內。因此，樣本資料集的正態分佈和中心極限假設允許我們建立5%作為顯著性水平。這是有道理的，因為在這種假設下，得到超出總體平均值兩個標準差的異常值的概率不到5%（100-95）。根據資料集的性質，其他顯著性水平可以取1%、5%或10%。對於金融計算（包括行為金融學），5%是公認的限額。如果我們發現任何計算超出了通常的兩個標準差，那麼我們就有一個很強的異常情況來拒絕零假設。

用圖形表示如下：

在上面的例子中，如果樣本的平均值遠遠大於2%（比如說3.5%），那麼我們拒絕了無效假設。另一種假設（平均值>2%）被接受，這證實了股票的平均日回報率確實在2%以上。

然而，如果樣本的平均值不太可能顯著大於2%（並且保持在，比方說，2.2%左右），那麼我們不能拒絕無效假設。如何對如此近距離的案件作出裁決是一個挑戰。為了從選定的樣本和結果中得出結論，需要確定一個顯著性水平，從而能夠得出關於無效假設的結論。另一種假設能夠確定重要程度或“臨界值”概念，以決定此類近距離案件。

根據教科書中的標準定義，“臨界值是一個臨界值，它定義了一個界限，如果零假設成立，超過這個界限可以得到少於5%的樣本均值。樣本意味著超過臨界值將導致拒絕無效假設的決定。” 在上面的例子中，如果我們將臨界值定義為2.1%，並且計算的平均值達到2.2%，那麼我們拒絕了無效假設。臨界值確定了接受或拒絕的明確界限。