2023年度“科普中國青年之星創(chuàng)作大賽”獲獎作品
作者:尹濤,鄭李垚
基因、遺傳、DNA……不知道從什么時候起,這些本來是遺傳學、生命科學領(lǐng)域?qū)I(yè)術(shù)語的詞語,頻繁出現(xiàn)在人們的日常對話中。
可是,你知道DNA和基因之間究竟是什么關(guān)系嗎?當我們提到遺傳時,我們談論的究竟是什么?這可是你我每時每刻、一舉一動背后的底層邏輯。如果沒有精妙的遺傳機制,生命絕對不可能演化成今天這個樣子。
從藍圖到“只是藍圖”
--從DNA到基因--
1953年,詹姆斯·沃森和弗朗西斯·克里克在《自然》期刊發(fā)表文章,提出了DNA的雙螺旋結(jié)構(gòu)模型,這是人類認識遺傳機制的重要里程碑。當然,其中還有羅莎琳德·富蘭克林和莫里斯·威爾金斯的貢獻,他們的早期研究為這個精妙的答案提供了關(guān)鍵數(shù)據(jù)。
為了幫助大眾迅速、直觀地理解DNA的結(jié)構(gòu),科學家借用許多日常生活中的物品來描述它。比如,DNA分子被形容成一架“繩梯”,上面的每個“梯級”代表一對按照特定規(guī)則配對的堿基。這個絕妙的比喻在信息簡化過程中有所疏漏,造成了信息的缺失。比起繩梯,DNA分子其實更像是一條拉鏈,配對的堿基恰似互相咬合的拉鏈扣;對了,這條拉鏈還得被人從兩頭拿著扭轉(zhuǎn)幾次,才能更貼切地模擬DNA分子的螺旋狀結(jié)構(gòu)。
那么,什么是基因?
基因是遺傳的基本單位,通常來說就是編碼一個或多個特定蛋白質(zhì)的核苷酸序列。(這里做了信息簡化,不夠嚴謹,請注意。)至于核苷酸,指的是DNA或RNA分子的基本組成單位,在DNA分子中是脫氧核糖核苷酸,在RNA分子中是核糖核苷酸。多個核苷酸聚合成核酸,“核酸”這個詞是不是有點兒耳熟?沒錯,過去幾年我們經(jīng)常掛在嘴邊的“做核酸”,就是指檢測病毒的DNA或RNA分子的核苷酸序列,簡稱核酸檢測。
--基因組:遠不止是基因--
在人們的普遍認知中,由DNA組成的基因繪制了生命的“藍圖”;基因?qū)腄NA序列就是一套神秘的“遺傳密碼”,生命的全部奧秘都藏在其中。
要把這件事說清楚,我們還需要簡單了解染色體和基因組。染色體是遺傳物質(zhì)的重要載體,可以看成由DNA和蛋白質(zhì)結(jié)合而成的“小包裹”。1956年,在瑞典隆德大學遺傳學研究所工作的美籍華裔遺傳學家蔣有興發(fā)表論文,稱人的體細胞中有46條染色體。(在此之前,美國醫(yī)生、細胞遺傳學家西奧菲勒斯·佩因特得出的結(jié)論是48條。)這是人類細胞遺傳學的開端。
一個人的正常細胞中有23對染色體,而基因就是染色體上的一個個片段,相互之間距離或近或遠,星羅棋布。每個基因都由一段或長或短的DNA序列組成。你很可能知道,DNA的“密碼本”上只有四個字母,可以用ATGC表示(算上它的“近親”、“搭檔”RNA,也不過區(qū)區(qū)五個字母,只需要在RNA分子中把T換成U就行了),對應DNA分子結(jié)構(gòu)中的四種堿基。而且這些字母的配對方式非常專一,在絕大部分情況下, A只認T(U),C只會和G配對。
聽起來簡單到令人難以置信,對嗎?如果再考慮到這樣一個事實,你一定會更加震驚:這基本上是所有生命體共用的遺傳密碼!
如此復雜又豐富多樣的生命,真的由這么簡單的機制決定嗎?
不如讓我們從頭梳理一下:DNA組成基因,對吧;那么,是不是所有的DNA都會組成基因?
當然不是。
原來如此!
那么,我們需要回答兩個問題:一是不同物種的基因數(shù)量差異有多大;二是組成基因的DNA占比有多少。
這里我們要先提到基因組這個概念,基因組包括某個物種的個體發(fā)育需要具備的所有遺傳信息,就人類而言可以簡單認為是所有染色體上DNA序列承載的信息(此處同樣有簡化)。請注意,基因組的范疇要比基因大,事實上大得多。
人類只有約2萬個基因。2001年,長達30億個堿基對的人類基因組草圖發(fā)布時,人們大跌眼鏡,因為2萬這個數(shù)字和科學家預測的約10萬個基因相去甚遠。換句話說,人類的基因數(shù)量和實驗室常用的小白鼠差不多,甚至沒比蠕蟲多出太多。
至于組成基因的DNA比例,僅為人類全部DNA序列的2%!也就是說,人類基因組中有98%的DNA序列并不組成基因。
--舉足輕重的“無用DNA”--
事實上,“無用DNA”具有復雜且重要的功能,并不難理解。試想,人類所具備的能力遠超小白鼠,是比蠕蟲復雜得多的生物,但這三個物種的基因數(shù)量差別不大;而且人類的基因中有相當一部分可以在其他生物的基因組中找到類似功能的“遠親”,那么占人類基因組容量98%的“無用DNA”舉足輕重,應該說得通吧?
圖源:妮莎·凱里《隱形的遺傳密碼》,中信出版集團2023年4月版
不過,這只是我們作為“事后諸葛亮”的后見之明。發(fā)現(xiàn)這些基因組“暗物質(zhì)”的科學家當時應該很失望,因為他們給這些基因以外的DNA取名“Junk DNA”,翻譯出來就是“垃圾DNA”或“無用DNA”,失望和困惑之情由此可見一斑。當時人們覺得,寶貴的基因就好像生活在垃圾堆里,剩下的DNA序列似乎只是基因組的“廢話”,是用堿基對寫成的“亂碼”,沒有什么實際功能。
“無用DNA”在很長時間里一直被遺忘在遺傳學研究的角落,無人問津,直到有一些反常的遺傳病例提醒科學家重新認識它們。比如,有一種俗稱“小飛俠病”(面肩肱型肌營養(yǎng)不良,英文縮寫是“FSHD”)的顯性遺傳病,科學家一直找不到對應的致病基因。這種疾病在西方人群中并不少見,發(fā)病率約為1/20 000,讓人無法正常微笑,而且會使患者的肩胛骨等部位變形,看上去就像兩只小翅膀。顯性遺傳病的特點是患者的父母中至少有一方一定患病,從某種程度上講應該較為容易找到致病基因??茖W家的確在患者的4號染色體上發(fā)現(xiàn)了一段超長的重復序列,可奇怪的是,這里并不是基因的安身之所。你一定猜到了,這里正是被視同垃圾的“無用DNA”序列。進一步研究顯示,至關(guān)重要的是一段“無用DNA”序列的重復次數(shù)。
我們不再展開去探討復雜的研究細節(jié)。盡管早在1885年,法國神經(jīng)病學家就對FSHD患者的臨床癥狀進行了描述,而且迅猛發(fā)展的遺傳學和細胞水平研究技術(shù)已經(jīng)讓我們對這種疾病的認識有了長足的進步,但2010年《科學》期刊上發(fā)表的一項研究指出,這種疾病潛在的遺傳機制依然難以捉摸。基因的確是一份藍圖,但它也只是一份藍圖而已。
藍圖落地,基因表達
我們的生命從一個細胞(受精卵)開始。不考慮特殊情況的話,身體的每個細胞中都有一份同樣的DNA序列,盡管如此,具體到每個細胞也只有一部分基因發(fā)揮作用。這不難理解,在你的腦細胞和肌肉細胞中,發(fā)揮作用的基因肯定不太一樣?;蛑械腄NA序列所記錄的遺傳密碼,會由被稱為RNA的信使分子傳遞和翻譯,變成具有不同氨基酸序列的蛋白質(zhì),才能發(fā)揮作用,這個過程叫作基因表達。要是無法表達,就算擁有再精妙的遺傳密碼也是無用。
科學家花了幾十年時間才意識到,那些曾被視同垃圾的“無用DNA”,其實在基因表達過程中起著超乎想象的重要作用。有些“無用DNA”片段是基因的開關(guān),能決定這個基因是否發(fā)揮作用;還有些“無用DNA”片段起著修飾作用,由某項功能或某個特征相關(guān)基因?qū)懗傻摹罢Z句”,到底能表達出百分之多少的原意,得聽它們的。
當身體的每個細胞讀取DNA序列中儲存的遺傳密碼時,受限于細胞所處環(huán)境的不同,“無用DNA”發(fā)揮的作用不同,基因的表達受到影響,同一個劇本就在不同的場景下衍生出了不同的表演。這是一門叫作表觀遺傳學的新科學的研究范疇。
--從端粒到泛基因組--
如果我們問一個人的成功是先天因素還是后天因素決定的,不同的人會給出不同答案,不過應該會有相當一部分人贊同“先天+后天”這個答案。對我們的每個細胞來說,情況也差不多是這樣。你可能聽說過“端?!边@個詞,它是一種“無用DNA”。把每條染色體看成一條鞋帶的話,端粒就像是鞋帶末端的金屬片堵頭,會隨著使用年限變長而磨損。一旦金屬片磨壞,鞋帶就會散開,很難穿進孔里了;而端粒的磨損就意味著生命體走向衰弱。那么,端粒的健康與什么因素有關(guān)?答案是先天遺傳與后天生活方式的相互作用。每個人的基因會影響出生時端粒的長度,以及它的磨損速率;你吃什么食物,每天睡眠如何,運動量怎么樣,心情好不好,有沒有和周圍的人保持穩(wěn)定的情感連接……你和外界的任何互動都會對端粒產(chǎn)生或大或小的影響。
2009年諾貝爾生理學或醫(yī)學獎得主伊麗莎白·布萊克本與加州大學舊金山分校衰老、代謝與情緒中心主任艾麗莎·伊帕爾在合作的《端?!芬粫袑懙溃骸盎蜇撠熒咸?,環(huán)境扣動扳機?!边@也是一個貼切的比喻,尤其是當涉及健康與疾病時。
2023年5月,第一張人類“泛基因組”草圖在《自然》期刊發(fā)布。首個人類基因組圖譜發(fā)布20年之后,泛基因組將不同地域、不同種族帶來的遺傳多樣性都納入其中。我們有理由相信,表觀遺傳學對此做出了相當?shù)呢暙I。
下一次看見一個嬰兒在成長的不同階段奇跡般地發(fā)展出特有的技能,能認人、跌跌撞撞地學會走路、咿咿呀呀地學說話,可別再只顧著感嘆生命竟然有其內(nèi)置程序了。畢竟,對于同樣一種技能,不同嬰兒的發(fā)育時間或早或晚;他們正在一步一步發(fā)展出自己的獨特個性,每個孩子都會是獨一無二的。當我們談論生命的藍圖時,請多想一想,不只是遺傳因素,你的生活方式、你所處的環(huán)境及與周圍人的互動也至關(guān)重要,決定著這張藍圖能創(chuàng)造出怎樣的作品。
參考文獻:
1. 妮莎·凱里:《隱形的遺傳密碼》, 祝錦杰譯, 中信出版集團,2023.
2. Cobb M, Comfort N. What Rosalind Franklin truly contributed to the discovery of DNA's structure. Nature. 2023 Apr;616(7958):657-660. doi: 10.1038/d41586-023-01313-5.
3. Lemmers RJ, van der Vliet PJ, Klooster R, et al. A unifying genetic model for facioscapulohumeral muscular dystrophy. Science. 2010, 329(5999):1650-1653.
4. 張成, 李歡.面-肩-肱型肌營養(yǎng)不良癥研究進展史[J]. 中國現(xiàn)代神經(jīng)疾病雜志, 2019 19(5):13.
5. 伊麗莎白·布萊克本, 艾麗莎·伊帕爾:《端?!? 傅賀譯, 湖南科學技術(shù)出版社, 2021.
6. Liao WW, Asri M, Ebler J, et al. A draft human pangenome reference. Nature. 2023, May;617(7960):312-324. doi: 10.1038/s41586-023-05896-x. Epub 2023 May 10.