隨著全球人口的不斷增長和氣候變化的加劇,農業作為支撐人類生存和發展的基礎產業,面臨著前所未有的挑戰。種子是農業的“芯片”,也是農業現代化的核心要素。農業育種是農業生產發展、糧食安全和環境保護的重要手段,在現代農業生產中發揮著關鍵作用。近年來,我國在生物育種和智慧育種創新領域取得了顯著進展,已成為全球第二大育種創新強國。然而,在新一代智慧育種技術領域,我國仍與美國存在明顯差距,而農業育種數據在這一過程中扮演著重要角色。農業育種數據是對農業育種過程進行記錄并可以鑒別的符號,包括通過基礎研究、應用研究和試驗開發等產生的數據,以及通過考察調查、觀測監測、檢驗檢測等方式取得并用于農業育種活動的原始數據及其衍生數據。它既是農業育種研究的重要基礎,也是推動農業可持續發展的重要資源。隨著農業育種工作的不斷深入,數據的積累和應用日益廣泛,農業育種數據的有效保護和合理開發利用成為了目前學界和產業界共同關注的問題。本文將從農業育種數據的來源與特點、保護與利用中的困境以及相應的策略等方面展開探討。
1 農業育種數據的來源與特點
在農業新品種選育過程中,對育種各項數據信息的掌握和了解直接關系到育種的成敗。從18世紀首次獲得人工雜交種以來,長期的育種過程積攢了大量的農業育種數據。20世紀以來,隨著遺傳學的發展,特別是分子生物學技術的廣泛應用以及高通量測序技術的發展,產生了海量作物育種相關基因及其表達數據,農業育種進入了數據驅動的新時代。總體而言,農業育種數據既有傳統的田間試驗記錄,也有大量的組學數據、室內檢測等實驗數據。
1.1 田間數據
農業育種是一項復雜的系統工程,涵蓋種質資源鑒定與創新、新基因發掘、育種技術研發、品種培育、種子生產及產業化等多個環節,圍繞新品種選育過程產生了大量的田間數據,包括各農藝性狀的田間調查結果,也包括土壤、氣候、水分等動態農業環境數據以及農業生產管理數據。其中,品種的農藝性狀和生長環境等農田數據,為農業生產提供了最直接的科學依據。
1.2 實驗數據
除了田間試驗和調查,科學實驗也是農業育種的重要手段。分子標記、轉基因、分子設計、基因編輯等現代育種技術的發展不僅極大地推動了農業育種進程,也產生了海量的基因組、轉錄組、翻譯組、表觀組、蛋白質組、代謝組等組學數據以及由現代智能儀器自動化記錄的表型數據。這些數據成為現代農業育種數據的重要組成部分。
1.3 農業育種數據的特點
農業育種數據涵蓋遺傳特性、環境適應性等多方面信息,數據屬性復雜,橫跨多個學科領域。同時農業育種數據既有田間試驗觀測、調查的數據,也有開展科學實驗的實驗數據,類型多樣而且數量龐大,具有類型多、來源廣、數據海量、時空分布廣、結構復雜的特點。農業育種服務范圍廣,在服務農業科學研究的同時也服務于政府管理決策和農業生產經營。因此,農業育種數據也需要在農業科技人員、政府部門管理者、企業經營者和農民間廣泛共享,具有多維性、動態性和共享性的特點。這些特點使得農業育種數據在優化農業生產結構和提升糧食安全方面發揮著基礎性的作用,同時也是目前農業育種數據保護與利用困境的重要因素。
2 農業育種數據保護與利用的困境
2.1 數據分散與重復
我國農業育種數據分布廣泛,不同的研究機構、企業、個人以及田間試驗點都有各自的數據記錄。由于缺乏統一的標準和平臺,農業育種數據往往存在分散、重復且難以整合的情況,存在嚴重的“數據孤島”和“數據海洋”問題。我國曾在育種領域建立過政府主導的全國大協作的科研體制,這種體制強調全國一盤棋,育種單位集中調配人力、物力資源,無私共享種質資源和技術成果,集中力量取得了雜交水稻等重大突破。目前我國科研機構分散,信息交流和育種資源共享不足,科研人員與企業長期合作開發意愿不高,種業企業將育種材料、試驗數據、育種方法等育種數據視為商業機密嚴格保護,原有的舉國體制優勢逐漸弱化。農業育種數據的分散和重復嚴重影響數據的綜合應用和共享,進而影響育種工作的效率和新品種的培育速度。
2.2 數據產權歸屬不明確
在農業育種中,育種數據涉及多個方面的貢獻,包括科研機構、企業和個人等,不同主體可能對同一數據有不同的貢獻。由于我國數據產權立法缺位,使得數據產權的歸屬與分配無法可依。農業育種數據歸誰所有、由誰使用、使誰獲益等產權歸屬問題尚且缺乏明確的科學界定,保護路徑不夠暢通。數據產權歸屬不明確不但影響了農業育種數據的開放共享和應用效率,制約農業育種工作的進一步發展,而且容易導致產權流失,使得農業育種數據缺少妥善保存,甚至被不當披露或收編入他人權利的控制范圍。
2.3 數據開放共享利用與保護不平衡
農業育種數據作為一種重要的農業信息資源,實現其共享不僅是現代種業科技發展的基礎,也是農業科技發展的牽動力。除了生產過程復雜、數據主體多元、數據存放分散等瓶頸問題外,數據的產權保護也是嚴重制約農業育種數據共享利用深度和廣度的重要因素。特別是在商業化育種中,數據的共享范圍需要合理界定。忽視知識產權保護,隨意使用數據將打擊數據所有者的積極性,而過度強調保護則會限制數據流動,造成資源浪費。只有通過育種數據的科學合理共享,才能夠整合各方面的研究和成果,提高育種效率,并推動農業育種領域的合作與交流,激發更多的創新和突破。2018年3月國務院辦公廳印發《科學數據管理辦法》,明確了各部門、單位科學數據開放共享的職責以及共享與利用的相關要求。但總體而言我國數據開放共享的知識產權保護體系尚未健全、數據共享管理制度還不夠完善,農業育種數據生產、管理、使用等利益攸關方“不愿、不敢、不會”的問題突出,數據在擁有群體“內部封閉式循環”現象仍較為普遍,對外開放共享較難。
2.4 數據存儲與管理的技術挑戰
育種技術的發展大致經歷了4個階段:“1.0”時代為馴化選育;“2.0”時代為雜交育種;“3.0”時代為分子育種;“4.0”時代則是智慧育種,即融合生命科學、信息科學與育種科學的智能設計育種。隨著現代生物技術的發展,農業育種數據量呈指數級增長,尤其是組學數據和表型數據的規模越來越大。如何高效存儲、管理和分析這些數據成為新的課題。科學數據是科技創新系統中最活躍的要素之一,通過數據驅動創新進而推動經濟社會發展,利用科學數據打造科技創新優勢已成為國際社會的普遍共識。然而,育種數據量的快速增長確實對數據保護和應用產生了多方面的影響。積極方面,更多的數據意味著更全面的信息,有助于提高育種工作的準確性;豐富的大數據為人工智能等技術提供了更多支持,促進了育種研究的進步;多樣化的數據可以更好地反映不同環境下的農業情況,提升育種的適應性。但消極方面,隨著數據量的增加,數據保護的難度也相應增大。例如,在數據分類、存儲和管理上需要更多的資源和更高效的機制。此外,隨著數據量的增加,確保數據的質量和準確性變得更加重要,這對數據處理提出了更高的要求。同時,數據之間的關聯性可能變得更加復雜,需要更深入的分析和整理。
3 農業育種數據保護與利用的策略
3.1 完善數據產權制度
數字經濟已成為繼農業經濟、工業經濟之后的主要經濟形態,是重組全球資源、重塑經濟結構和改變競爭格局的關鍵力量。中國數字經濟規模連續多年位居世界第二,數字經濟已經成為我國經濟發展的新引擎、新動能,對培育發展新質生產力,提升產業鏈、供應鏈韌性具有強大支撐作用。數據作為數字經濟時代重要的生產要素,已成為國家基礎性戰略資源。數據所有權、數據生產權、數據使用權、數據出版權、數據交易權等數據權屬問題是網絡和信息技術發展中的新挑戰,其根源在于個人、企業和國家在數字化和虛擬化過程中,數據的流動性和資源屬性不斷增強。在保護與利用之間找到平衡點是關鍵。建議建立明確的數據產權歸屬機制,例如通過法律或協議明確各方權利和義務,特別是在商業化育種中,確保數據在共享的同時,其創造者也能得到合理回報。
3.2 建立統一的農業育種數據庫
在數字經濟時代,科學數據的融合匯聚是形成新質生產力的關鍵。為了更好地促進數據的共享與利用,可以考慮建立覆蓋全國的統一農業育種數據庫。該數據庫需要具備靈活性和擴展性,能夠涵蓋不同維度的數據。如通過新型舉國體制突破種業戰略前沿和關鍵核心技術,對于應用技術、數據模擬、測試試驗等不適合以論文、專利呈現成果的支撐性服務,以任務完成進度和質量為考核標準,促進全國大協作。利用大規模農業育種數據庫、富集算法和生物數字模型,結合創新方法應用,通過基因挖掘和育種技術,打造以用戶需求為導向的大數據育種技術平臺。可將高價值的描述項置于顯著位置,并優化呈現方式,例如提供數據快照、關鍵圖表縮略圖等直觀信息,并折疊用戶關注度較低的描述項,以突出關鍵信息,從而建立用戶友好型的數據共享平臺。
3.3 推動數據共享機制
構建互惠共贏的數據開放共享機制,通過數據交換、服務交換、資助性狀功能鑒定評價、數據標記以及購買數據等方式,引導種業企業共享數據,引入國際育種數據資源,豐富數據來源,并持續優化育種數據的質量和結構,建立便利的數據獲取機制。同時也要注意,未共享本應共享的數據會造成資源浪費,而違規共享不應共享的數據則會威脅數據安全。因此明確產權、維護主權對于保障農業育種數據的安全共享至關重要。在明確育種數據的歸屬和使用權的基礎上,鼓勵數據的開放共享,平衡數據所有權和使用權的關系,促進數據的流動和應用,參考國際經驗,探索多樣化的數據使用模式,如數據的開放獲取、數據銀行等。
3.4 提高數據分析技術
面對海量數據,需要進一步提升數據管理與分析的技術水平。引入人工智能、大數據處理等技術能幫助更好地挖掘數據價值,并為農業育種提供更精準的支持。加速布局多維組學大數據和智慧育種基礎平臺建設,系統整合各育種基地和研究機構的育種數據。通過優化數據分析方法全面挖掘數據中的信息,解決育種數據量的增加和數據類型的多樣化問題;通過引入先進的分析工具和技術,如機器學習和人工智能,提高分析效率和準確性;通過標準化的數據格式和統一的標準,確保不同來源的數據能夠有效整合和比較;通過加強跨學科的合作,結合生物學、統計學等領域的知識,共同推動育種數據分析技術的發展。
3.5 推動國際合作與交流
農業育種數據的保護與利用不僅關系到國內農業生產,也對全球糧食安全具有重要意義。通過加強國際間的合作與交流,可以共同應對數據保護與利用的挑戰。通過建立國際協作網絡、舉辦國際會議和研討會等方式,各國科研機構和企業可以分享育種數據,促進育種學術交流和育種經驗分享,共同應對氣候變化和糧食安全挑戰。
4 農業育種數據的應用前景
在人工智能發展的歷程中,每一次范式變革不僅體現了技術手段的迭代升級,更深刻地揭示了人類在自我認知、社會組織模式及技術文明路徑構建上的根本重塑。如杭州深度求索人工智能基礎技術研究有限公司于2025年1月發布的DeepSeek-R1推理模型,在有限的GPU資源下,在較短的時間內成功訓練出世界一流的閉源推理大模型,并以開源形式提供給全球研究人員和開發者使用,展示了真正的開放精神,開啟了一扇通往無限可能的大門。數字科技的快速發展為我國縮小與種業強國的差距、構建精準高效的智能設計育種技術體系提供了機遇,中國種業借助數字科技的力量,有望實現跨越式的發展。隨著人工智能技術的發展,農業育種也將進入智能化時代。如生豬全域數智育種系統融合了人工智能與基因技術,不僅顯著提升了育種效率,還大幅降低了技術門檻,使育種過程更加簡單高效。可以預見,中國按照市場化、產業化模式,聚焦多組學、基因編輯、全基因組選擇、智能設計育種等關鍵技術,開展原創性技術攻關,創建基于基因型—表型—環境多維大數據的智能化育種方案,將有力提升中國育種科技創新能力,推動中國種業邁向“4.0”時代。在數字技術的支撐下,通過建立統一的數據標準和共享機制,建立科學的數據管理體系,加強國際合作,更好地發揮育種數據的作用,為保障糧食安全和促進農業可持續發展提供有力支持。在這個數據驅動的時代,只有有效保護和合理利用育種數據,才能確保我國在國際農業科技競爭中占據優勢地位。實現數據的高效整合與應用,為品種選育提供科學依據,這不僅加快了育種進程,提高了育種效率,而且有助于培育出更多適應不同環境條件的優良品種,推動農業現代化向著更高層次發展。(參考文獻略)
?本文來自《農業育種數據的保護與利用策略》
?作者:蔣海英,陳玉沖
?單位:廣西民族大學相思湖學院;廣西壯族自治區農業科學院
?刊于《中國種業》2025年第5期30-33頁 轉載請注明













