來源|崖州(zhou)灣國家實(shi)驗室
4 月 28 日,崖(ya)州灣國(guo)家實驗室精準設(she)計與智造(zao)團隊,中國(guo)農業大(da)學和(he)上海人工(gong)智能(neng)實驗室共同發布了首(shou)個種(zhong)(zhong)(zhong)業大(da)語言模(mo)型(xing)“豐登(deng)” ,英文(wen)名稱 Large Language Model for Seed Design (SeedLLM)。該模(mo)型(xing)集(ji)成了先(xian)進(jin)(jin)的(de)人工(gong)智能(neng)技(ji)術(shu)(書生(sheng)·浦語2.0)與大(da)數據分析(xi),對海量來自(zi)不同渠道的(de)育(yu)種(zhong)(zhong)(zhong)科(ke)研文(wen)獻、技(ji)術(shu)書籍及網(wang)絡(luo)資源進(jin)(jin)行(xing)深度解析(xi)和(he)索引(yin),在品種(zhong)(zhong)(zhong)選育(yu)過程、農藝(yi)性(xing)狀描(miao)述、栽培(pei)技(ji)術(shu)推薦和(he)歷史推廣區域查詢等(deng)四大(da)應(ying)用場景中,為用戶提供(gong)解釋和(he)回(hui)答。“豐登(deng)”模(mo)型(xing)在由國(guo)內育(yu)種(zhong)(zhong)(zhong)專家制定的(de)標準測評中表現遠超農學相關專業本科(ke)生(sheng),綜合得分是本科(ke)生(sheng)的(de)4.87倍。
該(gai)模型具(ju)有 4 大(da)核心能力:
1.整合(he)分散的知識資源:系統深度(du)挖掘并結(jie)構(gou)化我(wo)國在育種領域迄今(jin)積累的包括學術文獻、書籍、田間日志在內的廣(guang)泛知識。
2.跨領(ling)域(yu)知(zhi)(zhi)識融合:利用多學(xue)科(ke)知(zhi)(zhi)識圖(tu)譜,整合了生物(wu)學(xue)、遺傳學(xue)、氣(qi)象學(xue)、土(tu)壤學(xue)等相(xiang)關領(ling)域(yu)的(de)知(zhi)(zhi)識,發(fa)掘這些(xie)領(ling)域(yu)之間的(de)新聯系(xi)。
3.提高(gao)訪問(wen)效率(lv):通過自然語(yu)言對話接口降低了技術門檻,用(yong)戶可以直接提出問(wen)題并(bing)迅速(su)獲(huo)得易于理解的答案,提高(gao)育種工作(zuo)效率(lv)。
4.知識共享與傳(chuan)播:不僅服務于(yu)育種專家和(he)科研(yan)人員,也向全國的(de)農業工作者提(ti)供必要的(de)支持,加速了育種知識的(de)廣泛(fan)傳(chuan)播和(he)應(ying)用。

為全面評估“豐登”的專業性能,實驗室精準設計與智造團隊、中國農業大學和上海人工智能實驗室,組織育種專家設計了100道水稻育(yu)種(zhong)專(zhuan)(zhuan)業問題及(ji)對應標(biao)準(zhun)答(da)(da)案(an),涵(han)蓋品(pin)種(zhong)選育(yu)過(guo)程、農藝性狀描述(shu)、栽培技(ji)術推薦和(he)歷史推廣區(qu)域查(cha)詢四(si)大(da)任務(wu)。共計115人參(can)與本次標(biao)準(zhun)測(ce)(ce)評(ping),其中(zhong)包括(kuo)14名(ming)國內水(shui)(shui)稻(dao)(dao)育(yu)種(zhong)專(zhuan)(zhuan)家,49名(ming)農學相關(guan)專(zhuan)(zhuan)業研究生和(he)52名(ming)本科生(大(da)三及(ji)以(yi)上)。評(ping)估團隊通過(guo)排(pai)序(xu)和(he)打分(fen)的(de)方法,對“豐(feng)登”的(de)回答(da)(da)在準(zhun)確性、穩定性和(he)推理能力(li)等方面(mian)進(jin)行了(le)(le)細致評(ping)價。測(ce)(ce)評(ping)中(zhong)還引入了(le)(le)本科生的(de)回答(da)(da)作(zuo)為測(ce)(ce)試基準(zhun)。該測(ce)(ce)評(ping)結(jie)果(guo)表(biao)明(ming),“豐(feng)登”在最(zui)佳(jia)答(da)(da)案(an)個數和(he)綜合分(fen)數上的(de)表(biao)現(xian)均超出預期,且在多(duo)個評(ping)估維(wei)度上超越了(le)(le)語言模(mo)型國際領先水(shui)(shui)平(ping)代表(biao)Anthropic Claude3和(he)OpenAI GPT-4。這些結(jie)果(guo)充分(fen)證明(ming)了(le)(le)“豐(feng)登”種(zhong)業大(da)語言模(mo)型在處(chu)理水(shui)(shui)稻(dao)(dao)育(yu)種(zhong)相關(guan)知識方面(mian)的(de)潛力(li)。

“豐登(deng)”v0.1擁有 200 億(yi)參數(shu),現(xian)已開放水稻相(xiang)關知識的(de)測試接(jie)口(kou)申請。首(shou)批參與測試的(de)單位除崖州灣國(guo)家實驗室和中(zhong)國(guo)農(nong)業大(da)學(xue)外,還包(bao)括隆平高科、中(zhong)國(guo)科學(xue)院(yuan)、中(zhong)國(guo)農(nong)業科學(xue)院(yuan)、正大(da)集團、復旦大(da)學(xue)、華(hua)中(zhong)農(nong)業大(da)學(xue)、華(hua)南(nan)農(nong)業大(da)學(xue)、上海(hai)市農(nong)業科學(xue)院(yuan)、廣(guang)東省農(nong)業科學(xue)院(yuan)等。我們誠邀國(guo)內育種(zhong)領(ling)域各單位參與研發,提供高質量語料,涵蓋更(geng)多品種(zhong),助力中(zhong)國(guo)種(zhong)業。
有興(xing)趣參加測(ce)試和參與研(yan)發的單位,請聯(lian)系我們以獲取(qu)更多信(xin)息及測(ce)試申請表格。
聯系方式:
崖(ya)州(zhou)灣國家實驗室 楊博士
yangfan@yzwlab.cn
上海人工智能(neng)實驗室 董博士
dongnanqing@pjlab.org.cn
中國農業大學 王博士(shi)
wangxq21@cau.edu.cn
附1:對(dui)照模型介紹
1.GPT-4: 美國OpenAI公司開發的多(duo)模態語言(yan)模型,能夠(gou)生(sheng)成高質(zhi)量的文本(ben),并在數據分析(xi)、藝術創(chuang)作等(deng)多(duo)領域(yu)表現出(chu)色,被廣泛認為是目(mu)前全(quan)球最先(xian)進的語言(yan)處(chu)理工具。
2.Claude3: OpenAI 最大競爭對手Anthropic開發的人工智能語言模型,通過Constitutional AI技術減少(shao)誤導性內(nei)容(rong),提升了用戶交互質量。













