[問題] 不同複合假說對相同多重測試的解釋

時間Sun Nov 17 14:07:06 2024

To demonstrate that the new algorithm A is superior to the old algorithms B, C, and D, three comparison tests were performed. The results showed that A>B (p=0.009), A>C (p=0.002), and A>D (p=0.04). The overall significance level was 0.03. The multiplicity was corrected using the Bonferroni method. How does one interprete the results if the following tests were performed, respectively: (1) union-intersection test, (2) intersection-union test, and (3) intersection-intersection test? 根據上述多重測試的設定，整體顯著水準是 0.03/3 = 0.01。所以三個個別測試的顯著與否如下: A>B (p=0.009), 顯著 A>C (p=0.002), 顯著 and A>D (p=0.04), 不顯著單看上述測試結果，其解釋似乎是: 演算法 A 只比 B 和 C 好，但是無法判定其是否比 D 好--能說不比 D 差嗎? 還是只要不顯著就啥也不能宣稱? 問題是，完整的多重假說測試應該要考慮整體假說的不同(內容)類型去詮釋測試結果(?) 那麼在上述三種不同類型的整體假說下，怎樣個別詮釋上面所得的測試結果? (一) 聯交集測試整體零假說和代假說分別為不大於的交集和大於的聯集，因而要拒卻整體零假說需要滿足至少有一個個別測試是統計顯著的大於。上述測試結果滿足此要求，故可拒卻整體零假說而接受代假說，從而應解釋為: 測試結果證實新算法至少大於一個老算法。 (二) 交聯集測試: 整體零假說和代假說分別為不大於的聯集和大於的交集，因而要拒卻整體零假說需要滿足所有的個別測試都是統計顯著的大於。顯然測試結果不合要求，故不可拒卻整體零假說而接受代假說，從而應解釋為: 測試無法推翻(或否證)新算法至少不大於一個老算法…嗎? (三) 交交集測試: 整體零假說和代假說分別為不大於的交集和大於的交集，因而要拒卻整體零假說需要滿足所有的個別測試都是統計顯著的大於。顯然測試結果不合要求，故不可拒卻整體零假說而接受代假說，從而應解釋為: 測試結果無法推翻(或否證)新算法全都不大於那三個老算法…嗎? (四) 是否能夠或如何設計整體零假說與代假說，使其測試結果能得到和個別測試的結果相同的解釋? --

※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.36.207.45 (臺灣) ※ 文章網址: https://webptt.com/m.aspx?n=bbs/Statistics/M.1731823628.A.8CC.html ※ 編輯: saltlake (114.36.207.45 臺灣), 11/17/2024 21:08:37 ※ 編輯: saltlake (114.36.207.45 臺灣), 11/17/2024 21:11:16

1^F：推 jasonfun44: 演算法不會這樣檢定，也不是這樣用，這樣沒什麼意義 11/28 07:17

2^F：→ yhliu: 重點不是 "演算法", 而是統計假說檢定. 不過, 我所學太淺, 12/13 09:30

3^F：→ yhliu: 沒學過 intersection-intersection test. 12/13 09:31

這個是在美國聯邦食藥局關於搭配基因測試的藥品的規範看到的。現在有些藥品服用前要先對患者做基因檢測之後，再挑選針對特定基因形式的患者需要的藥品。這時候官方要求臨床試驗通過交集-交集測試(IIT)，亦即: 整體虛擬假說: 對每一個基因測試都顯示藥品無效對立 : 有

4^F：→ yhliu: 如果個別檢定顯著水準都是 0.01 的話, UI檢定會拒絕聯合的 12/13 09:33

5^F：→ yhliu: 虛無假說, 意謂 A>B, A>C, A>D 並非全部成立; 12/13 09:34

6^F：→ yhliu: IU檢定不拒絕虛無假說,意謂 A>B,A>C,A>D 至少一個成立. 12/13 09:36

7^F：→ yhliu: 上面錯了...UI test 的結果是 A>B or A>C or A>D 不被接受 12/13 09:39

8^F：→ yhliu: 唉! 又弄錯了, H0i 應是 A<=B, A<=C, A<=D, UI test 的結果 12/13 09:42

9^F：→ yhliu: 是三個虛無假說並非全部成立, 所以 A>B or A>C or A>D 至少 12/13 09:43

10^F：→ yhliu: 一個成立; 而 IU test 的結果是 A>B, A>C, A>D 並非全部成 12/13 09:44

11^F：→ yhliu: 立, 因為 A<=B, A<=C, A<=D 至少一個成立. 12/13 09:45

12^F：→ yhliu: 根據顯著水準0.01做個別檢定建構的 UIT 符合顯著水準0.03, 12/14 15:53

13^F：→ yhliu: 而IUT的顯著水準是0.01. 12/14 15:54

A>D (不顯著) 和 A<=D (不顯著) 會影響對結果的詮釋嗎? ※ 編輯: saltlake (114.36.244.51 臺灣), 12/16/2024 13:28:27

14^F：→ yhliu: "A>D 不顯著" 就是不能拒絕 "A<=D" 這個虛無假說。 12/17 07:56

15^F：推 jasonfun44: 怎麼重點不是演算法，假命題，跟本不用看後面的統計 01/05 06:53

16^F：→ jasonfun44: 基本假設就錯 01/05 06:53

17^F：→ yhliu: 真要比較演算法優劣當然可以訂定適當標準做客觀評估，這是 01/05 10:18

18^F：→ yhliu: 非統計方法。但是，涉及演算法比較至少還有兩種情形涉及統 01/05 10:22

19^F：→ yhliu: 計方法可使用統計假說檢定做評估，其一也是先擇定評估準則, 01/05 10:24

20^F：→ yhliu: 但不是用演算法性質的數學分析而是採用實驗方式以獲取各演 01/05 10:25

21^F：→ yhliu: 算法實證數據相互比較，這也是一種客觀比較。其次，可以由 01/05 10:27

22^F：→ yhliu: 一群評價者主觀評估演算法優劣，而以統計假說檢定判定各演 01/05 10:30

23^F：→ yhliu: 法在潛在使用者或評價者心目中的優劣。不過，就本問，我先 01/05 10:33

24^F：→ yhliu: 前說重點不在演算法而是統計假說檢定，因 "演算法比較" 只 01/05 10:35

25^F：→ yhliu: 是問題隨意敘述的一個例子，就像數學練習中很多例子，難道 01/05 10:37

26^F：→ yhliu: 重點在那些看起來毫無實用價值的 "實例" 而不是涉及的數學 01/05 10:39

27^F：→ yhliu: 方法和思路？ 01/05 10:40

如上述，如果演算法性能的比較，是純粹基於演算法的理論性質進行理論推導，而非利用實驗去驗證，當然用不到上面的統計假說檢定。具體像是偏微分方程式做不同的差分而得到不同的差分方程式。再用傅立葉分析對不同差分方程式做穩定性和一致性等的理論分析。這樣當然用不到統計推論方法。又或者是各種求根的演算法，如割線法或牛頓法等，比較其收斂與否和收斂速率，是基於數列歛散性質進行理論推導而得，當然不需要用統計推論。然而，倘若根本不知道演算法的理論性質，而是像做數據回歸那樣，假設某組數據符合某個數學模型，然後設定某個目標函數與限制，使用某個最佳化演算法去計算出該數學模型的最佳參數而得到最佳(近似)模型。最後用另一組數據去比對所得的數學模型的性能。這樣一來，和測試藥品在受試者樣本的藥效而進行統計推論，有啥不同? 遑論統計課本就有利用統計推論去比較不同最小方差回歸模型的參數的統計推論了。要宣稱「演算法的比較不需要統計檢定」，請寫明白，前所謂的演算法比較，使用怎樣的方法進行比較。 ※ 編輯: saltlake (114.36.222.209 臺灣), 01/05/2025 18:13:21

	[問題/行為] 貓晚上進房間會不會有憋尿問題
	Re: [閒聊] 選了錯誤的女孩成為魔法少女 XDDDDDDDDDD
	[正妹] 瑞典一張
	[心得] EMS高領長版毛衣.墨小樓MC1002
	[分享] 丹龍隔熱紙GE55+33+22
	[問題] 清洗洗衣機
	[尋物] 窗台下的空間
	[閒聊] 双極の女神1 木魔爵
	[售車] 新竹 1997 march 1297cc 白色四門
	[討論] 能從照片感受到攝影者心情嗎
	[狂賀] 賀賀賀賀賀！島村卯月！總選舉NO.1
	[難過] 羨慕白皮膚的女生
	閱讀文章
	[黑特]
	[問題] SBK S1安裝於安全帽位置
	[分享] 舊woo100絕版開箱!!
	Re: [無言] 關於小包衛生紙
	[開箱] E5-2683V3 RX480Strix 快睿C1 簡單測試
	[心得] 蒼の海賊龍地獄執行者16PT
	[售車] 1999年Virage iO 1.8EXi
	[心得] 挑戰33 LV10 獅子座pt solo
	[閒聊] 手把手教你不被桶之新手主購教學
	[分享] Civic Type R 量產版官方照無預警流出
	[售車] Golf 4 2.0 銀色自排
	[出售] Graco提籃汽座（有底座）2000元誠可議
	[問題] 請問補牙材質掉了還能再補嗎?(台中半年內
	[問題] 44th 單曲生寫竟然都給重複的啊啊！
	[心得] 華南紅卡/icash 核卡
	[問題] 拔牙矯正這樣正常嗎
	[贈送] 老莫高業初業 102年版
	[情報] 三大行動支付本季掀戰火
	[寶寶] 博客來Amos水蠟筆5/1特價五折
	Re: [心得] 新鮮人一些面試分享
	[心得] 蒼の海賊龍地獄麒麟25PT
	Re: [閒聊] (君の名は。雷慎入) 君名二創漫畫翻譯
	Re: [閒聊] OGN中場影片：失蹤人口局 (英文字幕)
	[問題] 台灣大哥大4G訊號差
	[出售] [全國]全新千尋侘草LED燈, 水草

WEB批踢踢(PTT)

Statistics 板

[問題] 不同複合假說對相同多重測試的解釋

熱門看板

贊助商連結