簡易檢索 / 詳目顯示

研究生: 曾仁佑
Tseng, Jen Yu
論文名稱: 使用倖存樹進行次群組分析
Subgroup Data Analysis Using Survival Tree
指導教授: 鄭又仁
Cheng, Yu Jen
口試委員: 邱燕楓
Chiu, Yen Feng
謝叔蓉
Shieh, Shwu Rong
學位類別: 碩士
Master
系所名稱: 理學院 - 統計學研究所
Institute of Statistics
論文出版年: 2016
畢業學年度: 104
語文別: 中文
論文頁數: 52
中文關鍵詞: 次群組分析決策樹右設限資料隨機森林
外文關鍵詞: subgroup analysis, decision tree, right censored data, random forest
相關次數: 點閱:3下載:0
分享至:
查詢本校圖書館目錄 查詢臺灣博碩士論文知識加值系統 勘誤回報
  • 此篇論文主要根據 Su et al. (2008) 的做法對右設限資料進行次群組分析 (subgroup analysis),要探討的包含 Interaction Tree 以及利用隨機森林(randon forest) 計算自變數對次群組分析的重要性,共兩種方法,我們試圖利用模擬與實際分析來觀察這些方法的表現。在實際分析中,我們分析一筆肺癌病人的資料,使用的自變數為病人的基因表現量,在自變數數量龐大的情況下,Interaction Tree 計算速度的問題便被顯現出來;在我們的想法中,決定先對自變數進行排序,篩選出前幾位邊際效應 (marginal effect) 較大的基因進行分析,從分析結果可以看見,療效有所差異的次群組確實可以經由此方法被定義出來。


    In this thesis, that we adopt the subgroup analysis to right censored data depends on the method of Su et al. (2008). There are two methods that include Interaction Tree and using the random forest to estimate the
    importance of each covariate for the subgroup analysis. We try to exploit simulation and real data analysis to observe the performance of them. In real data analysis, we analyze the data of the patients with lung cancer and
    use their gene expression as the covariate. However, in the large number of covariate, the problem of the calculation speed of Interaction Tree is manifest.
    In our envision, we decide to sort the covariate in advance and sift the front members having bigger marginal effect to analyze. In the result, the subgroup with heterogeneity of the treatment effect can be defined through this method exactly.

    1 緒論 1 2 文獻回顧 3 2.1 右設限資料介紹與其基本分析方式 . . . . . . . . . . . . . . . . . . 3 2.2 回歸樹 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 3 研究方法 12 3.1 Interaction Tree . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 3.2 變數重要性排序 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20 4 模擬 23 4.1 模擬一 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 4.1.1 模擬設定 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 4.1.2 模擬結論 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 4.2 模擬二 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 4.2.1 模擬設定 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 4.2.2 模擬結論 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 5 實例分析 28 6 結論 37 附錄 39 A 模擬一之結果 39 B 模擬二之結果 50

    Akaike, H. (1974). A new look at model identification, IEEE Transactions an Automatic Control 19: 716–723.
    Breiman, L. (2001). Random forests, Machine Learning 45: 5–32.
    Breiman, L., Friedman, J., Olshen, R. and Stone, C. (1984). Classification and Regression Trees, Belmont, CA: Wadsworth International Group.
    Cox, D. R. (1972). Regression models and life-tables (with discussion), Journal of the Royal Statistical Society, Series B 34: 187–202.
    Cox, D. R. (1975). Partial likelihood, Biometrikal 62: 269–276.
    Efron, B. (1983). Estimating the error rate of a prediction rule: improvements on cross-validation, Journal of American Statistical Association 78: 316–331.
    Leblanc, M. and Crowley, J. (1993). Survival trees by goodness of split, Journal of the American Statistical Association 88: 457–467.
    Su, X., Zhou, T., Yan, X. and Fan, J. (2008). Interaction trees with censored survival data, The International Journal of Biostatistics 4: 1–26.

    無法下載圖示 全文公開日期 本全文未授權公開 (校內網路)
    全文公開日期 本全文未授權公開 (校外網路)
    全文公開日期 本全文未授權公開 (國家圖書館:臺灣博碩士論文系統)
    QR CODE