圖蟲創(chuàng)意
自從2003年人類基因組計(jì)劃的草圖繪制完成以來(lái),科學(xué)家已經(jīng)對(duì)越來(lái)越多的地球生物進(jìn)行了基因組測(cè)序研究。所以我們今天知道,人類的基因組DNA含有約30億對(duì)堿基,大部分哺乳動(dòng)物的基因組大小也差不多。相對(duì)而言,細(xì)菌和真菌的基因組則小得多,分別是數(shù)百萬(wàn)對(duì)堿基和數(shù)千萬(wàn)對(duì)堿基。單看這點(diǎn)有限的數(shù)據(jù),似乎有一種趨勢(shì),就是越復(fù)雜的生物有著越龐大的基因組。然而情況并非如此。比如同樣是昆蟲,最小的基因組比哺乳動(dòng)物的基因組小,而最大的基因組比哺乳動(dòng)物的基因組還要大,最大的和最小的之間差了數(shù)百倍。植物基因組的跨度則更大,最大的和最小的基因組之間差異達(dá)到了數(shù)千倍。為什么基因組的大?。–值)會(huì)呈現(xiàn)這種狀態(tài)呢?生物學(xué)家們稱這個(gè)現(xiàn)象為“C值矛盾(C值佯謬)”。
就在今年6月,植物學(xué)家們?cè)谝黄撐闹袌?bào)導(dǎo)了迄今為止已知的最大的地球生物基因組。它來(lái)自一種生活在太平洋島嶼上的蕨類植物——披針葉梅溪蕨。由于此前就已經(jīng)知道蕨類植物往往有著非常大的基因組,所以這個(gè)研究團(tuán)隊(duì)在尋找最大基因組時(shí)就把目標(biāo)鎖定到了幾種分布在太平洋島嶼上的蕨類植物身上。這篇研究論文指出,披針葉梅溪蕨的基因組C值約為160.45 Gbp,也就是1604.5億對(duì)堿基。而我們?nèi)祟惖幕蚪MC值只有30多億對(duì)堿基,僅僅是披針葉梅溪蕨的50分之一。
你大概會(huì)以為這種有著龐大基因組的披針葉梅溪蕨是一種高大的植物,但實(shí)際上它的植株高度只有20厘米上下,是你在森林中也許根本不會(huì)多看一眼的“小透明”。披針葉梅溪蕨可謂“C值矛盾”的典型代表。那么,到底什么是C值呢?它又如何反映基因組大小呢?
“基因組大小”作為獨(dú)立的概念被提出時(shí),是指生物基因組中編碼蛋白質(zhì)的基因總數(shù)量。但是,這個(gè)概念很快就發(fā)生了變化,用以指一種生物的細(xì)胞核中一套DNA的總量,可以是用質(zhì)量(比如多少皮克)來(lái)衡量,也可以用堿基對(duì)的數(shù)量來(lái)衡量——我們今天說(shuō)的基因組大小概念便是如此。
可能有人會(huì)感到好奇:當(dāng)我們還沒(méi)有全基因組測(cè)序結(jié)果時(shí),如何能夠準(zhǔn)確知道基因組的大小呢?其實(shí)這方面的技術(shù)方法很多,比如我們可以對(duì)顯微鏡下染色體的影像進(jìn)行拍照,然后通過(guò)圖像處理軟件對(duì)染色體的體積進(jìn)行估計(jì),進(jìn)而估計(jì)DNA的總量。我們也可以通過(guò)專門的熒光染料對(duì)DNA進(jìn)行標(biāo)記,如果基因組大,那么標(biāo)記上的染料就多,熒光信號(hào)就強(qiáng)。最后通過(guò)流式細(xì)胞儀等設(shè)備對(duì)細(xì)胞內(nèi)的熒光強(qiáng)度進(jìn)行測(cè)量,就可以換算成DNA的總量了。像今天所說(shuō)的披針葉梅溪蕨的基因組,就是通過(guò)這種熒光染料的方法來(lái)測(cè)定大小的。通過(guò)全基因組測(cè)序可以準(zhǔn)確確定這種巨大基因組的大小。不過(guò)對(duì)很多種不同的生物使用這樣費(fèi)時(shí)費(fèi)力的測(cè)序技術(shù)之前,往往是先進(jìn)行上述快速檢測(cè)。
然而,要對(duì)不同生物的基因組進(jìn)行比較,還存在一個(gè)顯著的“不公平因素”,那就是基因組的多倍化現(xiàn)象。我們都知道,人類和其他大量的動(dòng)物基本上都是二倍體生物。也就是說(shuō),我們的遺傳物質(zhì)是由兩份非常接近的拷貝(基因組)共同組成的。我們每個(gè)人都從父母那里分別獲得了一份拷貝,所以才會(huì)同時(shí)獲得分別與他們類似的一些屬性。但是在其他生物(特別是高等植物)中,還存在很多多倍體生物。我們食譜上的很多植物都是多倍體生物。我們今天討論的披針葉梅溪蕨則是一種八倍體生物,也就是由8個(gè)非常類似的基因組拷貝組成。而披針葉梅溪蕨有一些近親卻是四倍體生物。這些生物之所以是近親,就是因?yàn)樗鼈兓蚪M中的一份拷貝是相當(dāng)類似的。但是由于一種是八倍體,一種是四倍體,結(jié)果遺傳物質(zhì)總量差了一倍。為了避免這種“不公平”的比較并體現(xiàn)基本遺傳物質(zhì)量,科學(xué)家使用C值這個(gè)概念來(lái)描述基因組的大小,指的就是細(xì)胞核中的一份基因組拷貝的大小。
披針葉梅溪蕨的C值(一個(gè)基因組的大小)為1604.5億對(duì)堿基,而它的體細(xì)胞內(nèi)全部DNA量還要乘以8,高達(dá)12836億對(duì)堿基。而描述我們?nèi)祟惢蚪M時(shí),大家所看到的30億對(duì)堿基就是它的大??;如果論起人類的二倍體細(xì)胞核內(nèi)的DNA量,則是60億對(duì)堿基(兩個(gè)基因組)。更準(zhǔn)確些,如果女性,大概是63.7億對(duì)堿基;如果是男性,則大約是62.7億對(duì)堿基。兩者的差別是由于性染色體造成的,男性(性染色體組成是XY)的Y染色體顯著小于X染色體(女性性染色體組成是XX)。
C值矛盾的成因是相當(dāng)復(fù)雜的,但是生物學(xué)家們已經(jīng)有了一些新發(fā)現(xiàn)。我們現(xiàn)在知道,基因組中除了編碼蛋白質(zhì)的基因外,還有很多編碼區(qū)域只轉(zhuǎn)錄成為RNA,在細(xì)胞里起到了非常多樣化的調(diào)控功能。如果把這些編碼RNA的基因也算在內(nèi)的話,基因組的C值往往與基因數(shù)量有對(duì)數(shù)相關(guān)性。不過(guò),這個(gè)規(guī)律僅在細(xì)菌、真菌等簡(jiǎn)單的生物中較明顯,對(duì)于人類和植物來(lái)說(shuō)情況更復(fù)雜。
更深入的進(jìn)化研究發(fā)現(xiàn),一類生物在不斷進(jìn)化的過(guò)程中,可能呈現(xiàn)基因組越來(lái)越小的退化現(xiàn)象??茖W(xué)家們?cè)诤铣缮飳W(xué)的研究中,也在不斷探尋如何構(gòu)建最簡(jiǎn)基因組的問(wèn)題。在這樣的背景下,披針葉梅溪蕨這樣的龐大基因組就顯得更加值得探究了。這或許與它們?cè)谔窖蠊聧u上缺乏競(jìng)爭(zhēng)對(duì)手有一定的關(guān)系。
本文為科普中國(guó)·創(chuàng)作培育計(jì)劃扶持作品
作者: 葉盛
審核: 梁前進(jìn) 北京師范大學(xué)生命科學(xué)學(xué)院教授
出品:中國(guó)科協(xié)科普部
監(jiān)制:中國(guó)科學(xué)技術(shù)出版社有限公司、北京中科星河文化傳媒有限公司