版權(quán)歸原作者所有,如有侵權(quán),請聯(lián)系我們

[科普中國]-生物多樣性信息學(xué)

科學(xué)百科
原創(chuàng)
科學(xué)百科為用戶提供權(quán)威科普內(nèi)容,打造知識科普陣地
收藏

生物多樣性信息學(xué)簡述

作為信息學(xué)的一個分支,生物多樣性信息學(xué)依賴計算機(jī)技術(shù)和信息學(xué)的普遍原則和技巧來處理異質(zhì)性基礎(chǔ)數(shù)據(jù),同時也需新創(chuàng)一些方法來解決特殊性問題。例如:如何在信息系統(tǒng)中建立物種名稱與分類群概念間的聯(lián)系,從而完整記錄分類學(xué)家多年來對某個物種認(rèn)識的歷史和變化過程;如何對早期的標(biāo)本米集信息進(jìn)行地標(biāo)化(Georeferencing),從而可以在大的空間尺度上進(jìn)行有效地空間分析和比較;如何為不同的數(shù)據(jù)和信息對象如物種、標(biāo)本、圖像和文獻(xiàn)信息建立全球信息唯 一標(biāo)識符,從而實現(xiàn)信息間的流暢共享和管理;如何能有效促進(jìn)人群間的互動合作,促進(jìn)人類對生物多樣性的認(rèn)知與針對性的活動,擴(kuò)大生物多樣性信息獲取的源頭等。

生物多樣性信息學(xué)和生物信息學(xué)(Bioinformatics)相互聯(lián)系但又有區(qū)別。前者主要關(guān)注物種到生態(tài)系統(tǒng)水平(Sarkar, 2007, 2009; Paton, 2009)的生命現(xiàn)象,而后者主要關(guān)注分子水平上的問題。也有研究者認(rèn)為生物多樣性信息學(xué)是生物信息學(xué)的一個研究方向(鐘揚(yáng)和張亮,2000)。不管怎樣,理解生物多樣性信息學(xué)研究及其與相關(guān)領(lǐng)域關(guān)系的問題在于:隨著數(shù)字化編目、數(shù)字化標(biāo)本館、數(shù)字化植物園等大量研究活動的涌現(xiàn),我們需要一個整體的知識框架來融合生物學(xué)家和技術(shù)專家的知識,規(guī)范相關(guān)的研究活動,一起來討論、規(guī)劃這一領(lǐng)域未來的發(fā)展藍(lán)圖。

目 前,生物多樣性信息學(xué)最重要的研究目標(biāo)就是為生物多樣性信息的管理和一些重要議題如全球變化研究提供一個堅實的下層建筑(Infrastructure)。 下層建筑在這里是一個寬泛的概念,它不僅指全球、地區(qū)或國家性生物多樣性信息系統(tǒng)的建立,分布式共享網(wǎng)絡(luò)體系的構(gòu)建,相關(guān)軟件和工具的研制,信息共享標(biāo)準(zhǔn)、協(xié)議和政策的制定;也包括研究組織、機(jī)構(gòu)和人才隊伍的建設(shè),對生物多樣性信息可持續(xù)增長、維持與利用的技術(shù)與平臺提供支持。1

生物多樣性信息學(xué)發(fā)展歷程生物多樣性信息學(xué)相關(guān)的實踐活動可以追溯到20世紀(jì)70年代早期第一個計算機(jī)分類學(xué)數(shù)據(jù)庫的建立。最早有文獻(xiàn)記錄的分類學(xué)數(shù)據(jù)庫可能是美國弗吉尼亞海洋科學(xué)研究所開發(fā)的Biota of Chesapeake Bay 數(shù)據(jù)庫和澳大利亞聯(lián)邦科學(xué)與工業(yè)研究組織(Commonwealth Scientific and Industrial Research Organisation,簡稱 CSIRO)開發(fā)的 DELTA(Description Language for Taxonomy)系統(tǒng)(Dallwitz,1974)。澳大利亞是生物多樣性信息學(xué)研究的先行者之一,70年代中期開始了標(biāo)本館標(biāo)本的數(shù)字化工作;1989年又發(fā)起了 Environmental Resources Information Network(ERIN), 來積累不同地理區(qū)域的環(huán)境數(shù)據(jù)。同時他們也發(fā)布了最早的標(biāo)本館數(shù)據(jù)共享協(xié)議和標(biāo)準(zhǔn)HISPID(Herbarium Information Standardsand Protocols for Interchange of Data) (http ://plantnet。rbgsyd.nsw.gov.au/HISCOM/HISPID/HISPID3/hispidright.html)。到了80-90年代,一些大型生物信息網(wǎng)絡(luò)系統(tǒng)和數(shù)據(jù)庫建立,例如墨西哥的CONA-BIO(1992年)、哥斯達(dá)黎加的INBio(1989年)、生物多樣性信息標(biāo)準(zhǔn)TDWG (Biodiversity InformationStandards: TDWG,簡稱 TDWG) (1985 年)、整合分類學(xué)信息系統(tǒng)(Integrated Taxonomic Information System,簡稱ITIS)(1996年),以及后來的物種2000項目(1996年)。進(jìn)入21世紀(jì),生物學(xué)數(shù)據(jù)庫和信息系統(tǒng)出現(xiàn)爆發(fā)式增長。根據(jù)生物多樣性信息學(xué)標(biāo)準(zhǔn)(TDWG)網(wǎng)站上的統(tǒng)計就有超過600多個生物多樣性信息學(xué)研究項目(http://www.tdwg.org/biodiv-pro-jects/projects-database/)(截至2010年3月)。數(shù)據(jù)和信息服務(wù)的內(nèi)容也從單一的分類學(xué)信息轉(zhuǎn)向覆蓋分類學(xué)、系統(tǒng)學(xué)、生態(tài)學(xué)、進(jìn)化生物學(xué)和生物地理學(xué)等生物多樣性相關(guān)的研究領(lǐng)域。

2000年以后,“生物多樣性信息學(xué)”這個詞語及其涉及的相關(guān)研究活動開始更為正式地出現(xiàn) 在科學(xué)研究群體。這一方面得益于科學(xué)家通過一些世界頂級學(xué)術(shù)刊物的專題欄目、增刊或者是學(xué)術(shù)會議專輯等連續(xù)報道。例如:science在2000年289卷的一個專欄中以生物多樣性的數(shù)字化、分類學(xué)的復(fù)興、網(wǎng)絡(luò)上的化石數(shù)據(jù)庫、安靜的革命一生物多樣性信息學(xué)、互聯(lián)網(wǎng)與生物多樣性數(shù)據(jù)庫的互操作性一生物多樣性信息在我們的計算機(jī)桌面等5篇文章討論了這個領(lǐng)域的相關(guān)問題(鐘揚(yáng)和張亮,2000)。Philosophical Transactions of the Royal Society of London, Series B: Biological Sciences 在2004年的“21世紀(jì)的分類學(xué)”專題中用19篇文章討論了與生物多樣性信息學(xué)相關(guān)的議題。BMC: Bioinformatics則于2009年專門在“生物多樣性信息學(xué)”專題下組織了10篇文章,特別是DNA條碼技術(shù)及其相關(guān)的研究進(jìn)展豐富了生物多樣性信息學(xué)的內(nèi)容。另一方面,近年來發(fā)展和運(yùn)作非常成功的一些全球性生物多樣性信息學(xué)研究項目也讓科學(xué)家們看到了這一領(lǐng)域發(fā)展的廣闊前景。

2009年6月在英國舉行的世界生物多樣性信息學(xué)國際會議 e-Biosphere’09(http://www.e-biosph-ere09.org/)則是生物多樣性信息學(xué)領(lǐng)域的第一次國際性盛會。有來自69個國家的500多名代表參加,齊聚了世界生物多樣性信息學(xué)領(lǐng)域最著名的機(jī)構(gòu)和科學(xué)家,比如:美國伍茲霍爾海洋生物學(xué)實驗室(Marine Laboratory Woods Hole, USA)和美國斯密森研究院(Smithsonian Institution)。除了在一些主流的生物學(xué)或計算機(jī)刊物上介紹和探討該領(lǐng)域的相關(guān)活動,科學(xué)家們還創(chuàng)立了一些在線電子刊物,例如:Biodiversity information(2004年創(chuàng)刊),來專門刊載這個領(lǐng)域的重要進(jìn)展。

我國植物科學(xué)工作者在20世紀(jì)80年代初期,敏銳地捕捉到國際植物自然科技資源領(lǐng)域數(shù)字化研究趨勢,并開始與國際同步進(jìn)行生物物種和標(biāo)本信息數(shù)字化的工作。代表性的工作包括:(1)中國科學(xué)院生物多樣性信息系統(tǒng)(Chinese Biodiversity Information System, CBIS)(http://cbis.brim.ac.cn/), 由動物學(xué)、植物學(xué)、微生物學(xué)、內(nèi)陸水體生物學(xué)和海洋生物學(xué)五個分部構(gòu)成,涉及各主要生物類群的物種編目、分類代碼、名稱、志書文獻(xiàn)、瀕危等級評估與保護(hù)策略等方面的信息;(2)中國動物信息網(wǎng)(http://www.animal.net.cn/),主要包含動物分類系統(tǒng)、物種名稱與編目、標(biāo)本查詢等資料;(3)中國微生物與病毒主題數(shù)據(jù)庫(http://www.micro.csdb.cn/),主要包括微生物與病毒編目、圖像、菌種保藏等方面的信息;(4)在中國科技部平臺項目“國家標(biāo)本資源共享平臺”的支持下,近年相繼建立了中國數(shù)字植物標(biāo)本館(Chinese Virtual Herbarium,簡稱 CVH)、國家數(shù)字動物博物館(http://museum.ioz.ac.cn/)、教學(xué)標(biāo)本標(biāo)準(zhǔn)化整合與資源共享平臺(http://mnh.scu.edu.cn/)、中國自然保護(hù)區(qū)資源平臺(http://www.papc.cn/)、國家?guī)r礦化石標(biāo)本資源信息網(wǎng)(http://www.nimrf.net.cn/)、極地標(biāo)本資源共享平臺(http://birds.chinare.org.cn/)等6個全國性的多樣性信息平臺。

此外,中科院植物研究所還初步建成了中國植物圖像庫(Plant Photo Bank of China,簡稱 PPBC)、中國自然標(biāo)本館(Chinese Field Herbarium:簡稱CFH)、物種2000-中國節(jié)點高等植物信息系統(tǒng)(Catalogue of Life: Higher Plants in China,簡稱CNPC)和中國數(shù)字植物園(Chinese Virtual BotanicalGarden,簡稱CVBG)等一批覆蓋全國植物標(biāo)本、圖像、物種和引種植物的信息系統(tǒng),相關(guān)研究力量也通過“中國科學(xué)院植物研究所生物多樣性信息學(xué)重點實驗室”的組織形式加以整合,形成當(dāng)前國內(nèi)規(guī)模最大的生物多樣性信息學(xué)研究團(tuán)隊。2

生物多樣性信息學(xué)研究內(nèi)容如同生物多樣性研究一樣,生物多樣性信息學(xué)涉及到的內(nèi)容寬廣而復(fù)雜。從信息學(xué)角度說,它覆蓋了從基礎(chǔ)數(shù)據(jù)的采集、存儲、整合、管理、發(fā)布和分析等多個環(huán)節(jié),還涉及到各種數(shù)據(jù)共享政策和標(biāo)準(zhǔn)的制定。從傳統(tǒng)研究領(lǐng)域說,它涉及到分類學(xué)、系統(tǒng)學(xué)、進(jìn)化生物學(xué)、生態(tài)學(xué)、保護(hù)生物學(xué)和生物地理學(xué)等多個學(xué)科和研究領(lǐng)域。綜合信息學(xué)的原則和所涉及生物學(xué)科的特點,我們將從基礎(chǔ)信息的數(shù)字化、信息化工具、標(biāo)準(zhǔn)和協(xié)議、模型工具以及國家和地區(qū)性生物多樣性網(wǎng)絡(luò)這5個方面來介紹生物多樣性信息學(xué)的主要內(nèi)容。它們分別代表了從基礎(chǔ)數(shù)據(jù)的收集整理、輔助性研究工具支持、信息交換和共享到數(shù)據(jù)挖掘和知識發(fā)現(xiàn)等信息化研究的幾個重要環(huán)節(jié),也是生物多樣性信息學(xué)研究最值得關(guān)注的幾個方面。

基礎(chǔ)信息的數(shù)字化全球植物保護(hù)戰(zhàn)略(Global Strategy for Plant Conservation,簡稱GSPC)包括16個全球植物保護(hù)目標(biāo)。為了有效地執(zhí)行和實現(xiàn)這些目標(biāo),需要獲得從小地區(qū)到全球空間尺度,涉及個體、居群、生態(tài)系統(tǒng)、遺傳和有機(jī)體各個層次的信息和數(shù)據(jù)。Paton(2009)結(jié)合這些目標(biāo)列舉了潛在和已有的各種信息化資源,指出要實現(xiàn)這些目標(biāo)需要的信息不僅數(shù)量巨大而廣泛,并且需要這些信息相互聯(lián)系,從而可以對它們進(jìn)行綜合分析和評估。

因此對基礎(chǔ)信息的數(shù)字化我們需要優(yōu)先考涉及生物多樣性基本問題最關(guān)鍵的信息成分,例如物種及其地理分布。這兩個方面的信息對回答如中國有多少植物物種、它們的地理分布格局如何、國家或地區(qū)尺度上應(yīng)該采取什么樣的保護(hù)策略等問題是非常關(guān)鍵的,也是保護(hù)生物學(xué)研究經(jīng)常涉及的問題,是我們認(rèn)知生物多樣性最基本的信息元素(Sarkar, 2007)。這兩方面的數(shù)據(jù)經(jīng)常被國外學(xué)者稱為生物多樣性基礎(chǔ)數(shù)據(jù)(primary data)(Soberon & Peterson, 2004;Chapman, 2005b;Chavan & Ingwersen, 2009)。此外,我們認(rèn)為生物多樣性基礎(chǔ)數(shù)據(jù)還應(yīng)該包括圖像和文獻(xiàn)信息。因此,物種、標(biāo)本、圖像和文獻(xiàn)基本上構(gòu)成了生物多樣性信息學(xué)研究中最主要的信息組分。

物種信息生命科學(xué)中最基本的科學(xué)問題是物種問題,生物物種的研究決定著從宏觀的全球生態(tài)系統(tǒng)至微觀的生命DNA分子構(gòu)造等全部內(nèi)容,更與國家目標(biāo)中的農(nóng)業(yè)、能源、信息、環(huán)境、人口與健康以及可持續(xù)發(fā)展等問題的研究和解決直接相關(guān)。物種信息這里使用較為寬泛的概念,包括用來描述物種的學(xué)名、異名、俗名、形態(tài)特征、地理分布、珍稀瀕危狀況、經(jīng)濟(jì)利用價值、保護(hù)利用情況等基本信息。

物種信息中最為關(guān)鍵的是編目,它是物種其他描述信息集的基礎(chǔ)。據(jù)科學(xué)家們粗略估計,地球上的37萬多種高等植物大概涉及到90萬個名稱,如果使用一些過時的分類學(xué)信息可能會引起混亂。例如:以前所認(rèn)定的不少珍稀瀕危物種是狹域分布,后來發(fā)現(xiàn),它們實際上和一些原來的廣布種是同種。IUCN在1997年的紅皮書中曾列舉了胡桃科的22個珍稀瀕危物種,其中9個已經(jīng)確認(rèn)實際上是一些廣布種的異名。在科學(xué)文獻(xiàn)中,只有不到5%的植物學(xué)名在使用時給出了明確的分類學(xué)定義的引證和來源。因此,不僅需要把應(yīng)用到同一個物種的不同名字(同物異名)關(guān)聯(lián)起來,而且要把相同名字應(yīng)用到不同植物(異物同名)的情況區(qū)別出來。如果我們不對引用物種名字的分類學(xué)含義給出明確的依據(jù)和來源,會給信息檢索、整合和分析造成極大的困難。據(jù)估計,異物同名的情況在植物中占據(jù)了大約4°%。

全球植物保護(hù)戰(zhàn)略的目標(biāo)之一就是提供一個當(dāng)前得到廣泛 認(rèn)可的物種名錄,并將異名關(guān)聯(lián)起來,向那些應(yīng)用了不同分類處理的信息源提供一個參考標(biāo)準(zhǔn),從而促進(jìn)不同來源信息的整合。當(dāng)前公認(rèn)的世界植物物種名錄已經(jīng)完成了大約60%,到2010 年可能達(dá)到85%(Paton et al , 2008)。物種 2000是當(dāng)前應(yīng)用最為廣泛的物種接受名和異名的信息來源,已經(jīng)成為檢索物種信息的一個基本的索引框架。雖然當(dāng)前已經(jīng)建立了如上所述的全球性、地區(qū)性和類群為主的編目數(shù)據(jù)庫,但是《生物多樣性公約》締約方大會認(rèn)為還應(yīng)該在國家水平上增強(qiáng)這方面的投入,加強(qiáng)分類學(xué)隊伍建設(shè)。生物分類學(xué)倡議及其履行進(jìn)展在這方面起到了重要作用(http://www.cbd.int)。

物種編目信息的數(shù)字化有非常悠久的歷史,從早期的邱園索引(Index Kewensis)到由許多國際組織聯(lián)合建立的國際植物學(xué)名索引(International PlantName Index, IPNI)、整合分類學(xué)信息系統(tǒng)(IntegratedTaxonomic Information System, ITIS)、美國密蘇里植物園的TROPICOS、全球生物物種名錄-物種2000(Catalogue of Life-Species 2000)等全球性電子名錄,以及以類群為主的國際豆科植物信息系統(tǒng)(Inter-national Legume Database & Information Service, 簡稱ILDIS)、全球菊科植物名錄(Global CompositaeChecklist)、世界茄屬植物資源(World Solanum Resource)、 魚類數(shù)據(jù)庫 (FishBase)和以地區(qū)為主的非洲植物名錄數(shù)據(jù)庫項目(African Plant Checklist and Database Project, APCD)(Klopper et al.,2007)、澳大利亞植物名稱索引(Australia Plant Names Index,APNI)、北美植物志整合系統(tǒng)(Synth- esis of theNorth American Flora, SNAF)等。

生物物種編目—物種2000項目是物種編目信息最有影響力的系統(tǒng),它由國際生物科學(xué)聯(lián)盟(The International Union of Biological Sciences, IUBS)發(fā)起,并聯(lián)合科學(xué)技術(shù)數(shù)據(jù)委員會(The Committee on Data for Science and Technology, CODATA)、國際微生物聯(lián)盟(The International Union of Microbiological Societies, IUMS)于1994年9月共同建立。它是一個與用戶、分類學(xué)家和贊助單位保持緊密合作的聯(lián)邦式數(shù)據(jù)庫系統(tǒng)(Federal Database)。成立的目的是建立一個包含全球主要生物類群的物種工作名錄(working list),并通過互聯(lián)網(wǎng)和光盤向全世界發(fā)布,提供免費(fèi)下載和使用。當(dāng)前該數(shù)據(jù)系統(tǒng)已有77個加盟的專家數(shù)據(jù)庫,包括了 1257735個生物物種(http://www.sp2000.org/)。ITIS和世界生物多樣性數(shù)據(jù)庫(ETI-WBD)都是物種2000的重要合作伙伴。它還向全球生物多樣性信息網(wǎng)絡(luò)(GBIF)和網(wǎng)絡(luò)生命大百科(EOL)等全球重要的生物多樣性信息機(jī)構(gòu)提供核心的物種名錄數(shù)據(jù)。物種2000項目的具體目標(biāo)是:針對當(dāng)前已知生物物種,提供一個具有一致性、經(jīng)認(rèn)可且可成為實際使用工具的名錄索引。

最近,由世界生物多樣性信息學(xué)最為成功的GBIF發(fā)起了 Global Name Architecture, GNA)(http://www.gbif.org/informatics/name-services/global-names-architecture/)項目,目的是要建立一個多層次的名稱數(shù)據(jù)體系,為將來更為廣泛的生物學(xué)信息整合奠定基礎(chǔ)。

標(biāo)本信息標(biāo)本館標(biāo)本是表明某個物種在某個時間和地點存在的第一手證據(jù),它提供的不僅僅是某個物種已知的分布信息,而且包括了大量歷史性信息(Chapman & Busby, 1994)。它不僅是分類學(xué)家進(jìn)行物種修訂的憑據(jù),也是開展生物多樣性研究的原始材料(Canhos et al., 2004; Graham et al., 2004a;Soberon & Peterson, 2004;Chapman, 2005a)。據(jù)粗略估計,保藏在世界各大標(biāo)本館和研究機(jī)構(gòu)的標(biāo)本達(dá)25-30億份(Duckworth, 1993; Soberon, 1999),估計有5-10%已被數(shù)字化(Soberon, 1999)?;ヂ?lián)網(wǎng)的發(fā)展,使大量數(shù)字化的標(biāo)本信息可以被訪問(Krishtalka & Humphrey, 2000;Causey et al., 2004;Graham et al, 2004a)。

數(shù)字化使這些標(biāo)本得到了更加廣泛的應(yīng)用,如傳統(tǒng)分類學(xué)修訂,名錄和鑒定手冊的編輯,動、植物志的編篆,地理分布圖的繪制,物種多樣性空間格局和動態(tài)的分析,生活史和物候?qū)W的研究,珍稀瀕危物種的保護(hù)生物學(xué),外來入侵物種的管理等等(Funk & Richarson, 2002; Chapman, 2005b)。數(shù)字化標(biāo)本信息潛在價值的挖掘要?dú)w功于地理信息系統(tǒng)(GIS)技術(shù)、空間分析手段和大量免費(fèi)獲取的電子化環(huán)境數(shù)據(jù)的組合應(yīng)用(Hijmans et al.,2005; Swenson, 2008)。一方面,通過給大量歷史標(biāo)本進(jìn)行地標(biāo)化處理,可以實現(xiàn)點對點地繪制物種分布的詳細(xì)信息圖,相對于傳統(tǒng)手工繪制點圖和輪廓圖方式來說,提高了制圖的準(zhǔn)確性?;谶@種GIS化的分布圖,還可以在統(tǒng)一的地理空間分析框架下展開大空間尺度上的比較生物地理學(xué)研究。另一方面,還可以利用這些地標(biāo)化的標(biāo)本信息,結(jié)合環(huán)境數(shù)據(jù)、氣候變化、土地利用、植被變化等信息對物種的潛在地理分布進(jìn)行預(yù)測,從而對入侵物種和珍稀瀕危物種的管理,特別是在全球氣候變化情景下的管理,作出更為科學(xué)的決策。

要實現(xiàn)植物物種分布的空間分析和預(yù)測,首先需要對這些歷史標(biāo)本進(jìn)行地標(biāo)化,也就是給它們的采集地點配上經(jīng)緯度坐標(biāo)。對于歷史采集信息,由于很多地點描述不規(guī)范,甚至信息完全缺失,以及早期的很多地名已經(jīng)發(fā)生了變化等原因,使地標(biāo)化成為一項非常復(fù)雜和艱巨的任務(wù)。多數(shù)情況下需要手工逐條核查并更正?,F(xiàn) 在已有一些工具來幫助處理地標(biāo)化問題,例如BioGeomancer。

盡管我們已經(jīng)有大量數(shù)字化的標(biāo)本信息可以利用,但是由于有些標(biāo)本在地理空間上的代表性不夠,有些標(biāo)本缺乏權(quán) 威和準(zhǔn)確的鑒定,再加上地標(biāo)化的坐標(biāo)信息不精確甚至錯誤,以及標(biāo)本鑒定信息沒有及時更新等原因,極大地限制了數(shù)字化標(biāo)本信息的應(yīng)用。GBIF是當(dāng)前世界上最大的生物標(biāo)本信息門戶,自2002年建立以來,已經(jīng)有50多個國家,40多個國際組織參與建設(shè),有超過1.7億份標(biāo)本信息,其中有經(jīng)緯度記錄的有花植物標(biāo)本信息達(dá)2700萬份。紀(jì)力強(qiáng)等(2005)對GBIF作過詳細(xì)的介紹。

圖像和文獻(xiàn)信息圖像信息在生物多樣性信息學(xué)研究中有著非常特殊的價值。它不僅包括野外調(diào)查和采集過程中拍攝的活生物的數(shù)碼圖像,也包括歷史標(biāo)本的后期影像處理,以及數(shù)字化植物志書等資料中的科學(xué)繪畫等內(nèi)容?,F(xiàn)代信息技術(shù)和數(shù)碼攝像手段的發(fā)展已經(jīng)賦予了生物圖片新的內(nèi)涵。它不僅可以展示生物物種在自然環(huán)境中的整體外貌,還能夠不受存儲空間限制詳盡地記錄物種形態(tài)特征的各個細(xì)節(jié)信息,例如:物種器官的顏色、質(zhì)地,以及棲息地和行為等。這些信息經(jīng)常是形態(tài)學(xué)描述、標(biāo)本和科學(xué)繪畫無法表現(xiàn)的。

國際上對圖像信息非常重視,比如DiscoveryLife(http://www.discoverlife.org)收集了超過 100 萬種生物的圖片,幫助讀者辨識物種??的螤柎髮W(xué)的鳥類學(xué)實驗室(http://www.macaulaylibrary.org)收集了12萬條脊椎動物(主要是鳥類)的音頻和4萬條視頻數(shù)據(jù),供科學(xué)研究和科學(xué)普及使用。牛津大學(xué)的The Virtual Field Herbarium 項目(http://herbaria.plants.ox.ac.uk/vfh/about/)提供了萬余張植物關(guān)鍵鑒定特征的圖像。The Linnaeus’ Collections (http://www.linnean-online.org/)項目專門致力于 Linnean早期研究的模式標(biāo)本、手稿、通信等信息的圖像采集,當(dāng)前已經(jīng)包括了 1.4萬余種植物,168種魚類,3198種昆蟲,以及3000多條信件和手稿的圖像信息。近年來,中國植物圖像庫(Plant Photo Bank of China, PPBC)在中國植物圖像信息的收集和整理方面也取得了可喜的進(jìn)展。當(dāng)前已經(jīng)收錄了植物圖片41萬余幅,初步鑒定的有24萬余張,分屬301科2523屬,共計11000多種(截至2010年1月)。

當(dāng)然,我們也不應(yīng)該忽視早期的許多植物科學(xué)繪畫的價值。植物科學(xué)繪畫是在科學(xué)研究的范疇之內(nèi),運(yùn)用繪畫技法,科學(xué)、客觀、藝術(shù)、真實地表達(dá)科學(xué)內(nèi)容的創(chuàng)作過程,它是表現(xiàn)植物、認(rèn)識植物的一個重要手段(孫英寶等,2008)。植物科學(xué)繪畫承載了大量早期植物學(xué)研究歷史的信息,是科學(xué)研究歷史中非常有意義的文化遺產(chǎn)。對于不少物種來說,已經(jīng)很少有機(jī)會在野外找到它們的蹤跡,而經(jīng)常是通過文獻(xiàn)記錄中的科學(xué)繪畫來認(rèn)知。綜合了野外活植物和科學(xué)繪畫等多種圖片載體的影像信息集將來或許能夠成為記錄物種多樣性圖像博物館。

大量生物多樣性研究的基礎(chǔ)信息還深藏在各種文獻(xiàn)之中。近年來,已有不少相關(guān)的文獻(xiàn)信息得到數(shù)字化(Davidson , 1997)。當(dāng)前與生物多樣性信息學(xué)研究最為密切的是生物多樣性遺產(chǎn)圖書館(BHL)(http://www.biodiversityl- ibrary.org/)項目。該項目最初由 American Museum of Natural History、The Field Museum、Harvard University Botany Libraries、 Missouri Botanical Garden、The New York Botanical Garden、 Royal Botanic Gardens和Smith-sonian Institution等10家單位共同發(fā)起。 BHL項目的開始階段主要將那些不涉及版權(quán)的老文獻(xiàn)數(shù)字化。隨著時間推移,不涉及版權(quán)的文獻(xiàn)會逐步增加,即所謂的墻體移動策略(moving wall strategy)。通過與Internet Archive(http://www.archive.org/ )的合作,BHL當(dāng)前已經(jīng)數(shù)字化了71000多冊書,并建立了方便的學(xué)名、關(guān)鍵詞、頁碼檢索方式。這些早期的每一篇?dú)v史文獻(xiàn)都可能包括著一個甚至多個生物有機(jī)體相關(guān)的信息。將這些信息與當(dāng)前最新的分類學(xué)研究結(jié)果建立關(guān)聯(lián),我們就有可能完整記錄和追溯特定研究對象的歷史研究過程和動態(tài)。

野外生物多樣性實體信息傳統(tǒng)上保存于標(biāo)本、圖像、文獻(xiàn)等實物信息媒介中的生物多樣性基礎(chǔ)信息,需要進(jìn)行數(shù)字化、地標(biāo)化之后才能在各種生物多樣性信息系統(tǒng)加以利用,生物多樣性采集與利用效率受到很大限制。相對于這個藍(lán)色星球上現(xiàn)存的各層次的生物多樣性,人類已經(jīng)采集的生物多樣性基礎(chǔ)信息僅是滄海一粟,有更多自然生存著的生物多樣性有待被記錄與發(fā)現(xiàn)。

相對于林耐與達(dá)爾文時代,當(dāng)今發(fā)達(dá)的交通系統(tǒng)、成熟的全球定位系統(tǒng)、多媒體信息采集技術(shù)以及以數(shù)據(jù)庫與互聯(lián)網(wǎng)為代表的信息技術(shù),使人們可以將整個地球看作活的生物多樣性博物館,直接將野外個體、居群、群落等各種水平的生物實體及其變化過程作為研究對象,將它們的形態(tài)、生態(tài)信息與地理分布坐標(biāo)數(shù)字化,形成數(shù)字標(biāo)本。數(shù)字標(biāo)本以數(shù)碼照片為主體,同時包含GPS坐標(biāo)、調(diào)查路線的GPS軌跡、采集與鑒定相關(guān)信息、其他信息的錄音記錄,是綜合的數(shù)據(jù)集,具有信息量大、效率高的特點。通過廣泛的公民科學(xué)協(xié)作,可以發(fā)動大量志愿者通過采集數(shù)字標(biāo)本的方式參與到生物多樣性的調(diào)查與監(jiān)測之中,極大提高生物多樣性信息的采集與加工效率,將人類的認(rèn)知活動與野外生物多樣性直接關(guān)聯(lián),同時滿足人們的科普教育、科研基礎(chǔ)數(shù)據(jù)采集、保育活動的前期調(diào)研與成效評估等多方面的需求。作為這些理念的實踐,中國自然標(biāo)本館(Chinese Field Herbarium, CFH)受到了用戶的歡迎,在兩年時間積累了大量的資料,包括86.5萬張數(shù)碼照片,其中約30萬張具有精確的GPS坐標(biāo),已鑒定植物種類超過1.2萬種。自2009年6月份以來,CFH日均新增照片2000多張,新增鑒定物種30多種,成為中國增長最快的生物多樣性原始數(shù)據(jù)源。

信息化工具傳統(tǒng)上我們對物種的鑒定主要依賴標(biāo)本館標(biāo)本、圖像和植物志書上的檢索表或請專家咨詢??茖W(xué)家們也開發(fā)出一些電子化的檢索工具,它們早期都被稱為“專家系統(tǒng)”。過去40多年來,已有許多這樣的工具被開發(fā)出來。DELTA可能是最早和應(yīng)用最為廣泛的電子檢索工具(Dallwitz, 1993;李健均,1996;陳翔和陳訓(xùn),2008;張明理,2009), Lu-cid是后來形成的一個商業(yè)化產(chǎn)品,主要在昆蟲學(xué)上有比較多的應(yīng)用。由于早期計算機(jī)技術(shù)的限制,這些工具都采用一些專有的數(shù)據(jù)存儲格式,并且只能在個人計算機(jī)上使用。后來的研究者開始開發(fā)一些能夠在互聯(lián)網(wǎng)上使用,便于不同系統(tǒng)交換數(shù)據(jù)的工具。比如eFlora的交互式檢索表(Brach & Song,2006)。這些工具很多都采用了 TDWG推薦的結(jié)構(gòu)化描述性數(shù)據(jù)(Structured Descriptive Data, SDD)標(biāo)準(zhǔn),并且能夠和早期的DELTA數(shù)據(jù)兼容。

物種鑒定的本質(zhì)是人們對物種實體資料的準(zhǔn)確認(rèn)知。除了將檢索表做成各種類型的鑒定工具外,建立信息化的互動平臺實現(xiàn)物種調(diào)查與認(rèn)知能力的共享具有重大現(xiàn)實意義,通過參與者們在資源調(diào)查與物種鑒定上擁有的不同能力的互補(bǔ)合作,能更好地滿足好奇心、提高認(rèn)知水平、促進(jìn)新物種資料的采集與整理鑒定。仿照傳統(tǒng)標(biāo)本館的鑒定流程實現(xiàn)的網(wǎng)上互動合作,將是物種鑒定的重要形式。近年來,網(wǎng)絡(luò)信息技術(shù)的發(fā)展使我們不僅僅是開發(fā)一些這樣的輔助性工具,而是更多地考慮如何將研究實踐的各個環(huán)節(jié)都納入信息化管理。尤其是對分類學(xué)這樣一個面臨大量基礎(chǔ)數(shù)據(jù)積累并不斷需要更新信息的研究來說更是如此。因此,研究人員開始考慮信息環(huán)境下分類學(xué)信息化能力建設(shè)的問題, 并開展了不少實踐活動。例如:由英國自然環(huán)境研究委員會(Natural Environment Research Council, NERC)資助,大英自然歷史博物館(The Natural History-Museum, London)、 牛津大學(xué)(University of Oxford)和邱園(Royal Botanic Gardens Kew)聯(lián)合發(fā)起的CATE (Creating a Taxonomic E-Science, http://www.ate-project.org/)項目、世界茄科植物數(shù)據(jù)庫(http://www.nhm.ac.uk/research-curation/research/projects/solanaceaesource/)項目、世界禾草數(shù)據(jù)庫 GrassBase(http://www。kew。org/data/grasses-db.Ht- ml)項目和歐洲分類學(xué)研究中心(European Distributed Institute ofTaxonomy, EDIT)等。

在這些項目的實踐中也產(chǎn)生了一些專門為分類學(xué)家提供服務(wù)的信息整合和管理工具,比較著名并得到廣泛應(yīng)用的是EDIT開發(fā)的Scratchpad(Smithet al, 2009)(http://scratchpads.eu/scratchpad-taxono-my)和 EOL 支持開發(fā)的 LifeDesk(http://www.Lifed-esks.org/)。這兩個工具都是基于開源的Drupal內(nèi)容管理系統(tǒng)進(jìn)行的改造。CATE項目也正致力于開發(fā)出一個所有分類學(xué)家都可以使用的網(wǎng)絡(luò)在線分類學(xué)修訂管理系統(tǒng)的模板。這些工具與早期鑒定工具的不同在于,它們從一體化分類學(xué)研究的工作程序出發(fā),在工具的設(shè)計和使用上充分考慮到分類學(xué)家對名錄、文獻(xiàn)、標(biāo)本、圖像等基礎(chǔ)數(shù)據(jù)資源的利用方式,及研究成果的在線發(fā)布。應(yīng)該說這些為專家們量身定做的工具已經(jīng)為我們進(jìn)入電子分類學(xué)研究時代奠定了技術(shù)基礎(chǔ)。

除這些鑒定和專家使用的分類學(xué)數(shù)據(jù)整合工具之外,生物多樣性信息遍及人類生產(chǎn)、生活的諸多方面,由人們在各種野外調(diào)查探索與研究認(rèn)知等各種互動合作性的活動過程中產(chǎn)生。如果將這個過程通過信息學(xué)解決方案讓野外數(shù)據(jù)采集、物種鑒定、數(shù)據(jù)組織等相關(guān)的活動盡量實現(xiàn)信息化,則使數(shù)據(jù)能更快地積累,更好地組織和有效地利用,以便更好地服務(wù)于相關(guān)知識的普及以及分類、進(jìn)化、生態(tài)、保育、馴化等學(xué)科的研究,讓喜歡、研究與利用生物多樣性的人都能從高效率的信息化工作流程,有效積累和組織的數(shù)據(jù)庫,以及互惠共享的交流氛圍中獲益。因此,覆蓋生物多樣性信息野外采集、自動化組織、互動合作整理等以生物多樣性信息業(yè)務(wù)流程信息化為目標(biāo)的技術(shù)體系與支撐系統(tǒng),是建立更高效率獲取與利用生物多樣性信息的必然要求。中國自然標(biāo)本館(CFH)采用包含數(shù)字化地標(biāo)化野外生物多樣性信息采集技術(shù)體系、網(wǎng)上互動鑒定、自動化數(shù)據(jù)組織與用戶互動空間等內(nèi)容的信息化平臺,展示了廣闊的發(fā)展與應(yīng)用前景。

信息標(biāo)準(zhǔn)與其他信息學(xué)相關(guān)的學(xué)科一樣,生物多樣性信息學(xué)也需要采用相關(guān)的數(shù)據(jù)和共享協(xié)議標(biāo)準(zhǔn),實現(xiàn)數(shù)據(jù)庫間數(shù)據(jù)傳輸和信息的互操作,加速信息交換和共享。這個過程中一般涉及到三類標(biāo)準(zhǔn):一是數(shù)據(jù)標(biāo)準(zhǔn)(data

standards),它處理的問題是我們需要共享什么樣的數(shù)據(jù);二是協(xié)議(protocols),即這些信息如何進(jìn)行共享;三是兀數(shù)據(jù)標(biāo)準(zhǔn)(metadata standards), 即向用戶提供一個信息摘要,告知用戶信息系統(tǒng)存儲的是什么樣的信息,可以提供哪些信息。數(shù)據(jù)標(biāo)準(zhǔn)是首要和最基礎(chǔ)的,它是實現(xiàn)協(xié)議和元數(shù)據(jù)標(biāo)準(zhǔn)的前提。

TDWG在這方面做出了非常卓 越的貢獻(xiàn)。這個組織早期主要致力于分類學(xué)數(shù)據(jù)庫的標(biāo)準(zhǔn)建設(shè),隨著生物多樣性數(shù)字化的發(fā)展,也開始研究生物多樣性信息方面的標(biāo)準(zhǔn)。這個組織到當(dāng)前已經(jīng)發(fā)布了涉及標(biāo)本米集信息的達(dá)爾文核心標(biāo)準(zhǔn)(Darwin Core,DwC) 和 ABCD(Access to Biological CollectionData),涉及植物學(xué)名和描述信息的TCS (Taxonomic Concept Transfer Schema) 和 SDD, 涉及植物地理分布記錄的 WGSRPD(World GeographicalScheme for Recording Plant Distributions)標(biāo)準(zhǔn),已經(jīng)整合數(shù)據(jù)和協(xié)議的SPM(Species Profile Model)、DiGIR、TAPIR等多個標(biāo)準(zhǔn)。

近年來,科學(xué)家越來越重視相關(guān)標(biāo)準(zhǔn)的實踐問題。國內(nèi)已經(jīng)成立了專門處理生物學(xué)信息化標(biāo)準(zhǔn)的組織,即全國生物信息標(biāo)準(zhǔn)化技術(shù)委員會,由國家標(biāo)準(zhǔn)化管理委員會領(lǐng)導(dǎo)和管理,來幫助相關(guān)項目和研究人員處理生物學(xué)信息標(biāo)準(zhǔn)及其相關(guān)的問題,以促進(jìn)和加強(qiáng)生物信息資源跨國界、跨部門的整合、共享、服務(wù)和應(yīng)用為目的。為了使信息化數(shù)據(jù)在不同應(yīng)用環(huán)境和研究領(lǐng)域發(fā)揮最大的價值,數(shù)據(jù)提供者、管理者和使用者都需要考慮采用統(tǒng)一的語言來描述基礎(chǔ)信息和數(shù)據(jù)。

模型工具一般來說,現(xiàn)存的生物多樣性基礎(chǔ)數(shù)據(jù)本身并不能直接為生物多樣性資源的管理和評估提供有效的決策依據(jù)。我們還需要經(jīng)過篩選、統(tǒng)計、分析、建模以及相應(yīng)的推理步驟才能變?yōu)橛杏玫男畔?,從而為我們評估現(xiàn)存生物多樣性知識的缺失,制定將來的研究計劃,評估保護(hù)的優(yōu)先性等提供參考。物種地理分布的生態(tài)位模型(Ecological Niche Model,EMs或ENM)是一個在生態(tài)學(xué)和生物多樣性信息學(xué)中快速成長的研究方向。

生態(tài)位模型的基本原理是利用地標(biāo)化的標(biāo)本分布信息,結(jié)合這些物種已知分布點的環(huán)境變量信息,來模擬物種的生態(tài)需求(生態(tài)位)。盡管生態(tài)位模型方法還處在發(fā)展的過程中,但科學(xué)家們對模型方法的不斷改善和廣泛應(yīng)用,已經(jīng)向我們展示了它在研究全球氣候變化對陸地和海洋生物多樣性影響,外來入侵物種的管理,物種的界定,新物種的發(fā)現(xiàn),以及進(jìn)化生物學(xué)等諸多研究方向上的巨大潛力。

生態(tài)位模型有許多可以利用的算法和技巧,比如 BIOCLIM(Nix, 1986), GLM (Generalized linear

models)(Austin et a/。, 1994), GAM(Generalizedadditive models) (Yee & Mitchell, 1991), CART(Regression and classification tree analyses), Genetic algorithms (Stockwell & Peters,1999)和 ANN (Artificial neural networks)(Olden &Jackson, 2002)。針對不同的數(shù)據(jù)類型和算法,不少開發(fā)人員也設(shè)計了許多工具。我們還需要設(shè)計出可以方便使用不同模型,并且對不同模型結(jié)果進(jìn)行比較分析的界面,從而使研究人員能夠更多關(guān)注對結(jié)果的分析和解釋。未來的發(fā)展是將數(shù)據(jù)輸入和投影圖層的生成放在一個連續(xù)的工作流程和框架下實現(xiàn),并且可以通過遠(yuǎn)程分布式計算和網(wǎng)格技術(shù)加快大量數(shù)據(jù)的處理。

全球、地區(qū)和國家生物多樣性網(wǎng)絡(luò)在歐洲委員會的支持下,歐洲建立了幾個比較大的生物多樣性網(wǎng)絡(luò)。CETAF(Consortium of European Taxonomic Facilities) (http://www.cetaf.org/)是聯(lián)合了歐洲自然歷史博物館、植物園和其他生物學(xué)采集保藏機(jī)構(gòu)的最大分類信息平臺。它包括大量動物、植物、古生物和地質(zhì)學(xué)采集,向多學(xué)科的研究人員提供服務(wù)。它致力于建立歐洲動物志的語義網(wǎng)絡(luò)體系,有400多位動物學(xué)專家參與。歐洲動物志包括了 115,000種非海洋動物物種及其地理分布等信息。這些信息和 ERMS(European Register of Marine Species) 相互補(bǔ)充,完善了歐洲動物物種的基礎(chǔ)信息。植物方面是歐洲植物志及歐洲-地中海植物多樣性數(shù)據(jù)庫(European Flora and the Euro+MedPlant Database)。歐洲自然歷史標(biāo)本信息網(wǎng)絡(luò)ENHSIN(European Natural History Specimen Infor-mation Network)項目的目標(biāo)則是在歐洲研究機(jī)構(gòu)間建立起標(biāo)本信息共享、互操作的信息基。BioCASE(Biological Collection Access Service forEurope)(http://www.biocase.org/)聯(lián)合了歐洲 30 個國家的35個研究機(jī)構(gòu)通過網(wǎng)絡(luò)提供生物學(xué)采集信息的服務(wù)。歐洲生物多樣性信息網(wǎng)絡(luò)ENBI (EuropeanNetwork for Biodiversity Information)(http://www.enbi.info/forums/enbi/index。php)項目發(fā)起于2003年,由歐盟給予經(jīng)費(fèi)支持,通過3年的工作完成語義網(wǎng)絡(luò)建設(shè)項目。它實際上也是GBIF在歐洲最大的數(shù)據(jù)提供者。當(dāng)前ENBI已經(jīng)包括了歐洲24個國家的66個機(jī)構(gòu)成員,其中包括GBIF國家節(jié)點成員。

美洲各國間生物多樣性信息網(wǎng)絡(luò)IABIN (Inter-American Biodiversity Information Network(http://www.iabin.net/)是由世界銀行和全球環(huán)境基金等多個機(jī)構(gòu)和組織資助的覆蓋西半球的生物多樣性基礎(chǔ)數(shù)據(jù)信息網(wǎng)絡(luò)。REMIB(World BiodiversityInformation Network) (http://www.conabio.gob.mx/remib_ingles/doctos/acerca_remib_ing.html)是一個覆蓋墨西哥的生物米集信息網(wǎng)絡(luò),當(dāng)前已覆蓋140多個國家,擁有超過600萬條的生物標(biāo)本信息。澳大利亞虛擬標(biāo)本館 AVH (Australian Virtual Herbarium)(http://www.anbg.gov.au/avh/)是澳大利亞植物學(xué)研究群體組成的在線網(wǎng)絡(luò)標(biāo)本館體系。除了通過GIS應(yīng)用程序已向用戶提供650萬份植物標(biāo)本信息外,它的最終目標(biāo)是形成一個電子化的植物區(qū)系研究網(wǎng)絡(luò),向政府、公眾提供決策和信息服務(wù)。AVH是一個真正意義上的分布式系統(tǒng),在這個平臺上查詢的標(biāo)本數(shù)據(jù)實際上都由各自標(biāo)本館來管理和發(fā)布。在國家科技部、環(huán)保部、中國科學(xué)院等多個部門的組織和支持下,經(jīng)過多年努力,也建立了動植物生物多樣性信息節(jié)點(http://www.biodiv.gov.cn/)、中國生物多樣性信息系統(tǒng)(http://cbis.brim.ac.cn/)、中國森林生物多樣性監(jiān)測網(wǎng)絡(luò)(http://www.cfbiodiv.org/)、中國生態(tài)系統(tǒng)研究網(wǎng)絡(luò)(http://www.cem.ac.cn/0index/index。asp)、中國自然保護(hù)區(qū)(http://www.nre.cn/)、中國數(shù)字植物標(biāo)本館(Chinese VirtualHerbarium, CVH)、中國植物圖像庫、中國自然標(biāo)本館、中國高等植物信息系統(tǒng)和中國數(shù)字植物園(Chinese Virtual Botanical Garden, CVBG)、中國植物物種信息網(wǎng)(http://www.plants.csdb.cn/)等一大批生物多樣性基礎(chǔ)信息系統(tǒng)。

但是我們應(yīng)該看到在全球、地區(qū)和國家水平上的生物多樣性網(wǎng)絡(luò)體系所面臨的一些挑戰(zhàn)。為了有效地執(zhí)行各種生物多樣性保護(hù)行動計劃,研究人員需要獲得從小地區(qū)到全球空間尺度,包含時間序列,涉及個體、居群、生態(tài)系統(tǒng)、遺傳和有機(jī)體各個層次的信息和數(shù)據(jù),并且需要對多個來源不同層次的數(shù)據(jù)進(jìn)行評估和分析。在全球范圍來看,這些信息當(dāng)前還沒有被有效地組織起來發(fā)揮它們應(yīng)有的作用(Paton, 2009)。首先我們需要建立有效的數(shù)據(jù)共享機(jī)制和標(biāo)準(zhǔn)來容納來自不同研究領(lǐng)域和學(xué)科以及不同研究層次和異質(zhì)性的數(shù)據(jù)源;其次要建立高效率的工作平臺與技術(shù)體系去更好地獲取最新的基礎(chǔ)信息;最后我們還需要開發(fā)出一些普遍適用的工具和系統(tǒng)。這對生物學(xué)家和計算機(jī)人員都是一個巨大的挑戰(zhàn)。

近年來,由世界40多個機(jī)構(gòu)和組織共同合作和參與的網(wǎng)絡(luò)生命大百科全書(EOL)項目向我們展示一個可以在全球、地區(qū)和國家水平上使用統(tǒng)一的工具、標(biāo)準(zhǔn)來整合分散的生物多樣性基礎(chǔ)信息的機(jī)會。EOL項目的發(fā)起來自有生物多樣性研究之父之稱的Wilson(2003)的一個簡潔而明確的想法。那就是為地球上已知的每一個生物物種建立一個網(wǎng)頁,這個網(wǎng)頁將展現(xiàn)該物種從分類、形態(tài)、地理分布、生態(tài)、進(jìn)化等宏觀研究,到DNA條形碼、分子、遺傳等微觀研究,以及利用和保護(hù)等百科全書式的信息集合,并且通過文本、圖像、多媒體、GIS等多種技術(shù)手段來展現(xiàn)豐富的信息。除了專業(yè)研究領(lǐng)域,一個不容忽視的群體是社會公眾。公眾通過公民科學(xué)的形式參加生物多樣性信息的采集已經(jīng)有幾百年的歷史。世界各國社會公眾關(guān)注與參與生物多樣性調(diào)查的熱情逐漸提高,已形成巨大的生物多樣性信息采集與加工的潛在力量,專門為公民科學(xué)提供的野外調(diào)查工具與網(wǎng)絡(luò)數(shù)據(jù)積累平臺也逐漸出現(xiàn)。在兼顧專業(yè)研究和公眾參與方面,EOL是值得肯定的。它是一個專家監(jiān)管和公眾參與的開放式系統(tǒng)。通過有效的專家體系保證數(shù)據(jù)的科學(xué)性和可靠性,同時也為對生物多樣性保護(hù)和利用有熱情的公眾和愛好者敞開了參與經(jīng)院式研究的大門。

無論是從宏觀上還是微觀上研究生物有機(jī)體,最根本的總是與具體的研究對象相聯(lián)系,這個具體對象就是生物物種。對于浩瀚的生物多樣性信息來說,物種是聯(lián)系所有信息的一個紐帶。因此,EOL項目找到了一條整合多個學(xué)科、研究領(lǐng)域、研究層次和不同來源信息的機(jī)制和方法。而且EOL及其相關(guān)的軟件工具都是采用開源形式,它所移植的分布式共享技術(shù)、Web2.0元素、MVC (Model-View-Controller)開發(fā)模式等使它成為一個靈活、可擴(kuò)展的門戶系統(tǒng)。盡管EOL項目當(dāng)前還在發(fā)展的初始階段,但它在研究思路和技術(shù)條件上的優(yōu)越性向我們展示了一個在全球范圍使用統(tǒng)一的標(biāo)準(zhǔn)和協(xié)議共享生物多樣性信息的美好前景。

展望信息技術(shù)的發(fā)展給我們很多新的方法來共享生物多樣性的基礎(chǔ)知識。一些世界性的研究項目,比如網(wǎng)絡(luò)生命大百科全書(EOL)、生物條形碼協(xié)會(CBOL/BOL)、全球生物物種名錄(COL)、生命之樹(TOL)、全球生物多樣性網(wǎng)絡(luò)(GBIF)在數(shù)字化生物多樣性信息基礎(chǔ)方面已經(jīng)建立了比較好的框架。這些項目在世界范圍的廣泛成功展示出信息化時代生物多樣性信息采集、共享和利用的新藍(lán)圖,并且將對科學(xué)研究群體和社會有深遠(yuǎn)的影響。這些影響包括了新物種的發(fā)現(xiàn)、珍稀瀕危物種保護(hù)策略的制定、新藥用植物的研發(fā)、人類在復(fù)雜生命網(wǎng)絡(luò)體系中的重要角色的認(rèn)識等等。

生物多樣性信息學(xué)是一個快速生長的領(lǐng)域。它把信息科學(xué)和相關(guān)的技術(shù)帶到了生物學(xué)領(lǐng)域,促進(jìn)了基礎(chǔ)生物多樣性知識更廣泛應(yīng)用。我們將看到一個史無前例的,在全球范圍通過廣泛的合作實現(xiàn)對自然生物多樣性的信息采集、調(diào)查與監(jiān)測,自由獲取生物在基因、有機(jī)體、物種、居群、生態(tài)過程、生態(tài)系統(tǒng)以及人類在生物多樣性系統(tǒng)中的作用等廣泛的信息的局面。

然而,我們也要認(rèn)識到生物多樣性信息學(xué)研究是一個長期而艱巨的任務(wù),還有許多未知問題值得我們?nèi)ヌ骄亢徒鉀Q。例如:我們需要建立一種長期機(jī)制,保證從個人和公共數(shù)據(jù)庫定期收集和更新數(shù)據(jù);通過同行評議(peer review)和自動校驗方式來實現(xiàn)對數(shù)據(jù)質(zhì)量的控制,建立對新增加信息的索引、鏈接和自動提交的處理流程,向用戶提供不僅是數(shù)據(jù)瀏覽和查詢,而且還包括深層次的數(shù)據(jù)操作和分析的界面等。

我們這一代比較完整地理解了我們所面臨的生物多樣性危機(jī)。同時,我們也可能是最后有機(jī)會去探究和記錄我們這個星球上物種多樣性的一代。我們這一時代最大的挑戰(zhàn)之一是用數(shù)字化的方法和手段來記錄我們所棲居星球的生物多樣性及其相關(guān)的知識遺廣。3