簡易檢索 / 詳目顯示

研究生: 李熾隆
論文名稱: 利用反轉與區塊互換進行基因體連續片段的重組
指導教授: 盧錦隆
口試委員: 盧錦隆
唐傳義
李家同
林苕吟
邱顯泰
學位類別: 碩士
Master
系所名稱: 電機資訊學院 - 資訊工程學系
Computer Science
論文出版年: 2013
畢業學年度: 101
語文別: 英文
論文頁數: 39
中文關鍵詞: 次世代定序基因體定序基因體連續片段組裝反轉區塊互換
相關次數: 點閱:2下載:0
分享至:
查詢本校圖書館目錄 查詢臺灣博碩士論文知識加值系統 勘誤回報
  • 次世代定序技術以日益漸低的成本快速地產生大量的基因體草圖。然而,這些基因體草圖通常只被部份定序成為一群未組裝好的基因體連續片段,這些未組裝好的連續片段是無法直接被現存研究基因重組與種族樹重建的演算法所使用。在本論文中,我們使用加權的反轉與區塊互換距離來研究單邊區塊排序的問題:給予一個部分組裝的基因體 π 與一個完全組裝的基因體 σ,該問題的目的是要找到一個最佳次序來組裝(即排序與決定方向)π 中的連續片段,使得 π 的組裝好的連續片斷與 σ 之間利用加權的反轉與區塊互換所衡量出來的基因體重組距離為最小,其中反轉與區塊互換的權重比為 1:2。除了基因體重組與種族樹重建之外,單邊區塊排序問題特別地在基因體重新定序上有很好的應用,因為根據一個參考基因體 σ 他的演算法就能夠被用來組裝一個基因體草圖 π 的連續片段。利用排列群,我們設計出一個有效率的演算法能夠在 O(δn) 的時間內解決單邊區塊排序的問題,其中 n 是基因的個數,δ 是把組裝好的基因體 π 轉換成基因體 σ 所需的反轉與區塊轉換的個數。除此之外,我們也證明出基因草圖的組裝在 O(n) 的時間內完成,而且組裝好的基因體與另一個完全組裝的基因體之間的加權基因體重組距離也能夠在 O(n) 的時間內被事先計算出來。最後,我們將我們的演算法實作成程式,並且利用模擬的資料去比較它與現存相似功能的工具 SIS 在利用參考基因體去組裝基因草圖連續片斷的準確度表現,其中SIS是根據一個只考慮反轉的啟發式演算法所實作出來的工具。我們的實驗結果顯示出當在 π 的完整基因體與 σ 之間參與基因體重組事件的反轉與易位個數增加時,我們的程式在準確度的表現是比 SIS 好。特別地,如果有更多的易位參與在基因重組事件中,那麼我們的程式與SIS之間在準確度表現上的差距就會逐漸增大。


    中文摘要 I Abstract II Acknowledgement IV Contents V List of figures VI Chapter 1 Introduction 1 Chapter 2 Preliminaries 5 2.1 One-sided block ordering problem 5 2.2 Permutation groups 6 2.3 A model for representing DNA molecules 8 Chapter 3 Algorithm 11 Chapter 4 Experimental results 33 Chapter 5 Conclusions 37 References 38

    Shendure J, Ji HL: Next-gereration DNA sequencing. Nature Biotechnology 2008, 26:1135-1145.
    Mardis ER: The impact of next-generation sequencing technology on genetics. Trend in Genetics 2008, 24:133-141.
    Metzker ML: Sequencing technologies – the next generation. Nature Reviews Genetics 2010, 11:31-46.
    Fertin G, Labarre A, Rusu I, Tannier E, Vialette S: Combinatorics of Genome Rearragements. Cambridge, Massachusetts: The MIT Press; 2009.
    Gaul E, Blanchette M: Ordering partially assembled genome using gene arrangements. Lecture Notes in Computer Science 2006, 4205:113-128.
    Bourque G, Pevzner PA: Genome scale evolution: reconstructing gene orders in ancestral species. Genome Research 2002, 12:26-36.
    Hannenhalli S, Pevzner PA: Transforming cabbage into turnip: polynomial algorithm for sorting signed permutations by reversals. Journal of the ACM 1999, 46:1-27.
    Bentley DR: Whole-genome resequencing. Current Opinion in Genetics and Development 2006, 16:545-552.
    Koboldt DC, Ding L, Mardis ER, Wilson RK: Challenges of sequencing human genomes. Briefings in Bioinformatics 2010, 11:484-498.
    van Hijum SAFT, Zomer AL, Kuipers OP, Kok J: Projector 2: contig mapping for efficient gap-closure of prokaryotic genome sequence assemblies. Nucleic Acids Research 2005, 33:W560-W566.
    Richter DC, Schuster SC, Huson DH: OSLay: optimal syntenic layout of unfinished assemblies. Bioinformatics 2007, 23:1573-1579.
    Assefa S, Keane TM, Otto TD, Newbold C, Berriman M: ABACAS: algorithm based automatic contiguation of assembled sequences. Bioinformatics 2009, 25:1968-1969.
    Rissman AI, Mau B, Biehl BS, Darling AE, Glasner JD, Perna NT: Reordering contigs of draft genomes using the Mauve Aligner. Bioinfor在這裡鍵入方程式。matics 2009, 25:2071-2073.
    Munoz A, Zheng CF, Zhu QA, Albert VA, Rounsley S, Sankoff D: Scaffold filling, contig fusion and comparative gene order inference. BMC Bioinformatics 2010, 11:304.
    Husemann P, Stoye J: r2cat: synteny plots and comparative assembly. Bioinformatics 2010, 26:570-571.
    Dias Z, Dias U, Setubal JC: SIS: a program to generate draft genome sequence scaffolds for prokaryotes. BMC Bioinformatics 2012, 13:96.
    Huang YL, Lu CL: Sorting by reversals, generalized transpositions, and translocations using permutation groups. Journal of Computational Biology 2010, 17:685-705.
    Blanchette M, Kunisawa T, Sankoff D: Parametric genome rearrangement. Gene 1996, 172:GC11-GC17.

    無法下載圖示 全文公開日期 本全文未授權公開 (校內網路)
    全文公開日期 本全文未授權公開 (校外網路)

    QR CODE