首頁> 高通量測序 >動植物基因組測序

動植物基因組測序

動植物基因組從頭測序

產品介紹

簡介:

    基因組從頭測序也叫de novo測序,主要針對基因組序列未知的物種,構建不同類型的基因組DNA文庫,并進行序列測定。然后使用生物信息學方法對測序得到的序列進行拼接、組裝和注釋,從而獲得該物種完整的基因組序列信息。

 一、技術路線

    動植物基因組從頭測序的主要策略:1、對短片段Shotgun文庫(300-1000 bp)進行深度測序,確保序列覆蓋度和測序準確性,獲得基因組基本序列信息;2、構建較長插入片度的Mate pair文庫(2 kb、5 kb、8 kb、10 kb、20 kb)并測序,確定短片段序列間的相對位置,通過拼接組裝獲得基因組序列框架,在此基礎上通過生物信息學方法進行基因注釋和分析。

Illumina MiSeq數據為主,結合Illumina HiSeq2000數據

二、生物信息分析

1.原始數據整理、過濾及質量評估

 2. 基因組序列拼裝與分析:

     ♦基因組序列拼裝

     ♦基因組拼裝效果評估 (Contig N50、Scaffold N50、基因組大小和GC含量 )

 3. 功能元件分析:

     ♦蛋白編碼基因預測

     ♦非編碼RNA預測

     ♦蛋白編碼基因的功能注釋

     ♦蛋白編碼基因的KOG和GO注釋

     ♦蛋白編碼基因的代謝途徑注釋(KEGG pathway)          

4.根據客戶要求進行個性化分析    

三、結果展示

四、樣品要求

1、DNA樣品:Miseq DNA PE文庫濃度≥20ng/μl,總量≥6μg(熒光定量);Miseq DNA MP文庫濃度≥40 ng/μl,總量≥12 μg(熒光定量);454 DNA庫濃度≥20 ng/μl,總量≥3 μg(熒光定量),電泳檢測無明顯RNA條帶,基因組條帶清晰、完整,主帶應在100 kb以上。若樣品中有多糖、糖蛋白的殘留,對打斷DNA樣品帶來非常大的困難,且很難去除,因此特別要求所提供的樣品不要有多糖或糖蛋白污染。

 2、動物樣品:對于一般物種應挑選肝臟、腎臟、血液等組織取樣,對于珍貴物種請提供耳樣、毛發(帶毛根)等脂肪含量較少的組織進行取樣。為了減少個體差異對后續拼接產生的影響,盡量從同一個個體中取樣。若物種體積較小,從一個個體中提取的DNA量不能滿足測序實驗所需,在保證量的前提下,應盡量減少采樣個體的數量。提供組織樣品應>500 mg,盡量提供較多量,不同的物種DNA提取產量有差異。

 3、植物樣品:植物材料應盡量選取植物組織幼嫩部位。提供組織樣品應>500 mg,盡量提供較多量,不同的物種DNA提取產量有差異。

五、華津優勢

1. 利用Illumina MeSeq平臺的長讀長優勢和Illumina HiSeq2000的高通量優勢,能獲得高質量的基因組圖譜。

2. 已完成多項大型動植物基因組測序項目,有豐富的基因組測序及分析經驗。

3. 可根據實際需求個性化定制基因組測序方案。

經典案例一

蒙古馬和普氏野馬全基因組測序

背景:普氏野馬(蒙古野馬)(Equus ferus przewalskii)屬于馬科,原產于蒙古國西部科布多盆地和中國新疆準噶爾盆地東部一帶,因此也被稱作蒙古野馬或準噶爾野馬,是世界上僅存的野馬,具有6000萬年的進化史,被世人譽為“活化石”,是研究家馬起源和品系人工選育不可或缺的材料,也是保存馬類動物遺傳多樣性及用于家馬性狀改良和育種的珍貴物種。蒙古馬是中國乃至全世界較為古老的馬種之一,主要產于內蒙古草原,是典型的草原馬種,被農業部確定為138個國家級畜禽遺傳資源保護品種之一。
目的:運用Illumina HiSeq2000平臺對一匹雄性蒙古馬和一匹雄性普氏野馬全基因組進行測序,同時通過Roche 454 FLX+平臺對另外一匹雌性蒙古馬的8個組織進行深度轉錄組測序,以便得到普氏野馬和蒙古馬的基因組序列和基因注釋信息。通過對馬屬動物核型進化的研究,進而揭示哺乳動物核型進化機制。

 結果:雄性蒙古馬和雄性普氏野馬在拼接組裝中分別組裝了2 Mb和3 Mb的Y染色體序列,獲得了迄今為止最完整的馬的Y染色體的序列圖譜;通過蒙古馬5號染色體與普氏野馬23、24號染色體間的序列相似性分析,確認了蒙古馬和普氏野馬間的一次染色體羅伯遜易位事件,并且發現羅伯遜易位并沒有導致染色體更多的局部重排,說明羅伯遜易位和染色體局部重排可能是由不同的機制引起的。研究還發現兩種重復序列對基因組的不穩定性有著強烈的影響。

原文索引:[Huang J L, et al. Analysis of horse genomes provides insight into the diversification and adaptive evolution of karyotype. Sci. Rep, 2014, 4: 4958.]

 經典案例二

駱駝全基因組測序                 

背景:駱駝是駱駝科,駱駝屬的動物,分單峰駝、雙峰駝兩種。野駱駝生活在中國西北和蒙古西南部,能夠忍受酷熱和酷寒,并且適應貧瘠和稀缺的植被。駱駝有諸多特性:一天之內,駱駝的體溫可能經歷從34到41攝氏度的巨大變化;駱駝進食八倍于牛和羊的鹽,血糖水平是其他反芻動物的兩倍,但并未罹患糖尿病和高血壓;駱駝還能制造一種名為重鏈抗體的抗病蛋白。

 目的:運用Roche 454 FLX+、Illumina和SOLiD平臺對駱駝全基因組進行測序,通過與已測序完成的其它物種的比較基因組學分析,研究駱駝的進化歷史,從而了解駱駝特殊生活習性和生理特性,解釋駱駝在極端環境下生存能力的分子機制,為野生駱駝保護和家養駱駝品種改良提供指導。

結果:雙峰駝全基因組大小為2.38 Gb,發現20,821個蛋白編碼基因。在其它已完成基因組測序的物種中,雙峰駝與牛的遺傳關系最近,預計的分化時間大約在5500萬—6000萬年前。快速進化分析發現,調節胰島素信號途徑的基因在雙峰駝中存在快速進化。研究還發現駱駝具有多個CYP2J基因拷貝,CYP2J基因與高壓升高相關。研究同時解析了駱駝嗅覺基因、解毒基因和免疫球蛋白的遺傳分子特征。 

原文索引:[ Meng H, et al. Genome sequences of wild and domestic bactrian camels. Nat Commun, 2012, 3: 1202-1209.]

常見問題

1、Q:基因組框架圖和精細圖有什么不同? 

    A:框架圖能覆蓋基因組常染色體區域90%,覆蓋基因區域95%,Contig N5到5 kb,Scaffold N50達到20 kb,單堿基錯誤率在十萬分之一以下。精細圖能覆蓋基因組常染色體區域95%,覆蓋基因區域98%,Contig N5到20 kb,Scaffold N50達到300 kb,單堿基錯誤率在十萬分之一以下。   

2、Q:動植物基因組從頭測序時為什么需要構建不同類型的文庫?

  A:因為動植物基因組大、復雜度高,且存在大量的重復區域,因此需要制備不同梯度的測序文庫,進行雙末端測序,使得在拼接中能夠跳過大范圍的重復區,從而避免了基因組中重復序列造成 的錯拼,提高了拼接的質量;同時結合BAC或Fosmid文庫以及多種測序平臺的綜合運用,保證了測序的準確性和基因組的完整性,高效經濟的完成高等動植物的基因組圖譜繪制。

3、Q:在動植物基因組從頭測序中,不同測序平臺分別有什么優勢?

  A:Roche 454 FLX+具有長讀長能力,單條序列最長能達到1000 bp,可以為基因組的組裝提供高質量的框架。Illumina HiSeq2000平臺優勢測序數據量大,成本低,可以為基因組測序提供高覆蓋率的數據。Illumina MiSeq平臺同時具有長讀長和高覆蓋率的優勢,是基因組測序的較好選擇。根據物種基因組的特點及復雜程度,華津生物會科學地設計測序實驗方案,合理地將多個平臺搭配在一起使用,既能解決復雜基因組的測序難題,保證基因組測序的質量,同時也能兼顧實驗項目的經濟性。


動植物基因組重測序

產品介紹

簡介:

    基因組重測序是對已知基因組序列物種的個體進行基因組測序,并在此基礎上對個體或群體進行比較基因組學分析。通過全基因組重測序可以找到大量的單核苷酸多態性位點(SNPs)、插入缺失(InDel)、結構變異(Structure Variation,SV)等變異信息,廣泛應用于群體遺傳學、臨床醫藥、動植物分子育種等眾多領域。

 一、技術路線

 

Illumina Miseq、Illumina HiSeq2000 

二、生物信息分析

1. 原始數據整理、過濾及質量評估

2. 基因組重測序分析:

    ♦與參考基因組比對
    ♦SNPs和InDel的檢測
    ♦SNPs和InDel的注釋

3. 根據客戶需求進行個性化分析

三、結果展示

                             

四、樣品要求

1、DNA樣品:Miseq DNA PE文庫濃度≥20 ng/μl,總量≥6 μg(熒光定量);Miseq DNA MP文庫濃度≥40 ng/μl ,總量≥12 μg(熒光定量);454 DNA庫濃度≥20 ng/μl,總量≥3 μg(熒光定量),電泳檢測無明顯RNA條帶,基因組條帶清晰、完整,主帶應在100 kb以上。若樣品中有多糖、糖蛋白的殘留,對打斷DNA樣品帶來非常大的困難,且很難去除,因此特別要求所提供的樣品不要有多糖或糖蛋白污染。

2、動物樣品:對于一般物種應挑選肝臟、腎臟、血液等組織取樣,對于珍貴物種請提供耳樣、毛發(帶毛根)等脂肪含量較少的組織進行取樣。為了減少個體差異對后續拼接產生的影響,盡量從同一個個體中取樣。若物種體積較小,從一個個體中提取的DNA量不能滿足測序實驗所需,在保證量的前提下,應盡量減少采樣個體的數量。提供組織樣品應>500 mg,盡量提供較多量,不同的物種DNA提取產量有差異。

3、植物樣品:植物材料應盡量選取植物組織幼嫩部位。提供組織樣品應>500 mg,盡量提供較多量,不同的物種DNA提取產量有差異。

 四、華津優勢

1、豐富的基因組重測序及分析經驗。

2、可根據實際需求個性化定制測序及分析方案。

經典案例一
水稻基因組重測序
背景:水稻是一年生禾本科植物,基因組大小約為400 Mb,12對染色體,既是重要的經濟作物,也是經典的模式生物。
目的:很多重要的農藝性狀都是由多基因控制,并且單個基因僅僅起了微小的效應,因此進行鑒定和克隆往往非常困難。利用水稻突變體與原野生親本雜交構建F2群體,通過重測序(MutMap)進行基因定位。

 

結果:選取一個日本骨干水稻栽品種的7個突變體,鑒定出來與突變表型相關的基因組區域,并對其中的一個突變體進行了驗證。表明通過重測序可以快速獲得突變基因,加速水稻和其它作物的遺傳改良。
[ Abe, A., S. Kosugi, et al. "Genome sequencing reveals agronomically important loci in rice using MutMap." N a t B i o t e c h 30(2): 174-178. ]
經典案例二


雞基因組重測序

背景:雞是第一個完成基因組序列測定的農業動物(2004年),是研究脊椎動物遺傳、進化和發育重要的模式生物。

目的:利用高通量測序技術對家雞及其野生祖先紅原雞進行全基因組重測序,研究雞在幾千年馴化過程中的遺傳變異。
                               
結果:研究發現了超過7,000,000個SNPs、1,300個缺失(deletions)和若干選擇性清除(selective sweeps)。家雞中促甲狀腺激素受體(TSHR)基因存在顯著變異,這也許與被馴化動物的一個典型特征相關。另外,家雞它沒有野生種群中所見的季節性生殖的嚴格調控。同時,研究發現在肉雞群體中檢測到的幾個選擇性清除片段,與生長、食欲和代謝調控相關的基因重疊在一起。
原文索引:[ Rubin CJ, Zody MC, Eriksson J, et al. Whole-genome resequencing reveals loci under selection during chicken domestication. Nature, 2010, 464: 587-593 ]


常見問題
1、Q:為什么要進行動植物全基因組重測序?
 A:利用二代測序進行動植物全基因組重測序,可以獲得大量的單核苷酸多態性(SNPs)信息、序列的插入缺失位點信息。通過對獲得的海量信息進行分析比對,能夠獲得個體或群體間基因   組水平的差異,發現或檢測與疾病發生相關序列位點信息,開發高密度SNP分子標記,實現遺傳進化分析及重要性狀候選基因預測。  
2、Q:動植物全基因組重測序需要多少覆蓋深度?
 A:重測序的覆蓋深度是由所測物種的類型及項目的具體需求決定的。例如,采用Illumina進行人類基因組重測序,如要獲得絕大多數的變異信息,一般建議覆蓋深度需達30×以上。

体彩36选7