簡易檢索 / 詳目顯示

研究生: 林志偉
Chih-Wei Lin
論文名稱: 隱私洩露風險估計之模擬研究
A Simulation Comparison on the Estimation of Disclosure Risk
指導教授: 趙蓮菊
Anne Chao
口試委員:
學位類別: 碩士
Master
系所名稱: 理學院 - 統計學研究所
Institute of Statistics
論文出版年: 2003
畢業學年度: 91
語文別: 中文
論文頁數: 42
中文關鍵詞: 隱私洩露風險
外文關鍵詞: Disclosure Risk
相關次數: 點閱:3下載:0
分享至:
查詢本校圖書館目錄 查詢臺灣博碩士論文知識加值系統 勘誤回報
  • 在統計學上常使用抽樣調查來了解母體的一些特性,而抽樣的資料中常含有個體(例如人、家庭或公司等)的詳細資料,在抽樣調查結束後,隨著調查結果及抽樣資料的公布,經由分類的結果,資料可以回推至母體中相對應的個體。例如在台灣某家銀行信用卡用戶之分類資料中,以年度總消費金額分類之後,發現年度總消費金額超過十億的用戶在母體中僅有一位。因此若該銀行在公開其信用卡用戶的分類抽樣資料後,出現一位用戶其信用卡年度總消費金額超過十億,我們便可以藉由銀行公開的用戶之分類抽樣資料,回推至母體中相對應的個體,如此一來雖然抽樣資料中沒有該用戶的姓名身份,但若母體該類別中的個體僅有一位,則該個體的隱私便會受到洩露。
    因此對於公布調查資料後是否會洩露個體隱私,我們可以以母體中只有一個個體的類別數之比例來當作洩露隱私之風險,當比例愈高表示公布抽樣資料後,會洩露個體隱私的風險愈高,反之,則洩露個體隱私的風險愈低。

    在過去的文獻中,有許多不同模式的假設,目前較常用的有Zayatz (1991) 或Greenberg and Zayatz (1992) 及Bethlehem, Keller and Pannekoek (1990) 所提出的估計量,因此本文主要對這兩個估計量以模擬的方式作綜合詳細的討論與比較分析,並對Zayatz (1991) 或Greenberg and Zayatz (1992) 所提出的估計量推導其漸近變異數,最後由模擬及實例的結果顯示,這兩個估計量的表現會受到母體變異係數的大小而不同,並且會隨著抽樣比例的增加而改變其估計量的表現。


    第一章 緒論 01 第二章 模式假設與回顧 03 2.1 符號說明 ………………………………………………… 03 2.2 模式假設 ………………………………………………… 04 2.3 Zayatz估計量回顧 ....…………………………………… 04 2.4 Bethlehem, Keller and Pannekoek估計量回顧 …...……. 06 第三章 估計量的討論 09 3.1 Zayatz估計量的討論 …………………………………… 09 3.2 Bethlehem, Keller and Pannekoek估計量的討論 ……… 10 3.3 Zayatz估計量之漸近變異數 …………………………… 11 第四章 模擬研究結果與分析 14 4.1 估計量的模擬條件與方法 ……………………………… 14 4.2 估計量的模擬結果與討論分析 ………………………… 21 第五章 實例分析 24 第六章 結論與建議 28 附表 29 參考文獻 42

    1. Bethlehem, J.G., Keller, W.J., and Pannekoek, J. (1990). Disclosure Control of Microdata. Journal of the American Statistical Association, 85, 38-45.
    2. Chao, A., Lee, S.M. and Jeng S.L. (1992). Estimating Population Size for Capture Probabilities Vary by Time and Individual Animal. Biometrics 48, 201-216.
    3. Darroch, J.N. (1958). The Multiple Recapture Census I:Estimation of A Closed Population. Biometrika 45, 343-359.
    4. Greenberg, B. and Zayatz, L. (1992). Strategies for Measuring Risk In Public Use Microdata Files. Statistica Neerlandica 46, 33-48.
    5. Harris, B. (1968). Statistical Inference in the Classical Occupany Problem Unbiased Estimation of the Number of Classes. Journal of the American Statistical Association 63, 837-847.
    6. Zayatz, L. (1991). Estimation of the number of unique population elements using a sample. Proceedings of the Section on Survey Reseearch Methods, American Statistical Association, Washington, D.C., 369-373.
    7. 王麗堯 (2002)。有限母體下的種類數估計與種類數預測之模擬研究。〔清華大學統計學研究所碩士論文〕

    無法下載圖示 全文公開日期 本全文未授權公開 (校內網路)
    全文公開日期 本全文未授權公開 (校外網路)
    全文公開日期 本全文未授權公開 (國家圖書館:臺灣博碩士論文系統)
    QR CODE