
全國人大代表,,民建中央副主席,中國工程院院士,,清華大學醫(yī)學院教授,,生物芯片北京國家工程研究中心主任 程京
2023年,ChatGPT的出現(xiàn)標志著人工智能行業(yè)進入到了以大模型為代表的快速發(fā)展階段,。2024年初SORA所產出的視頻更是加速了AGI發(fā)展的步伐,。未來基礎大模型與行業(yè)大模型的結合將會成為AGI時代的操作系統(tǒng),為各行業(yè)領域開啟第四次產業(yè)革命,。
大模型已經從ChatGPT文本信息對話,、DALL.E文本生成圖片走到了最近的SORA文本生成視頻。而黃仁勛,、張亞勤,、周鴻祎等認為AI大模型的下一站是生命健康,解碼生命語言編碼,,最大限度接近人類“永生”的夢想,。
生命現(xiàn)象本質也是一種自然進化的精密語言編碼,尤其是生命科學領域中微觀世界的分子序列數(shù)據(jù),,這種語言編碼與自然語言具有許多相似之處,,例如,蛋白質可以通過一個代表著氨基酸的字符序列表示,,這與自然語言具有語法限制類似,。
近年來,AI已經具備了理解真實世界的能力,,AI制藥也將會迎來新的飛速發(fā)展,。大模型的快速發(fā)展使其已經具備了理解模擬世界的能力,大模型與醫(yī)藥行業(yè)的結合有望革新藥物研發(fā)范式,,而數(shù)據(jù)是大模型變得“聰明”的關鍵,中醫(yī)藥幾千年積累的知識寶庫作為優(yōu)質數(shù)據(jù)資源需要盡快占領,,構建中醫(yī)藥多模態(tài)大模型,,搶占中醫(yī)藥大模型高地迫在眉睫,。
而目前國內提出的中醫(yī)藥大模型普遍以中醫(yī)藥傳統(tǒng)經驗知識圖譜作為訓練數(shù)據(jù),缺乏與生命底層語言的作用聯(lián)系和顛覆性創(chuàng)新,。由于生命是核酸和蛋白質等物質組成的分子體系,,它具有不斷繁殖后代以及對外界產生反應的能力。當人患病服用中藥后,,藥物成分就會與體內的分子物質,,如核酸、蛋白質,、糖等產生作用而發(fā)揮療效,,過程中涉及人體疾病生命語言靶標發(fā)現(xiàn)、中藥對人體生命分子作用功能的大規(guī)模底層實驗數(shù)據(jù),、中醫(yī)藥算力算法等復雜計算和實驗,、臨床論證過程等。為了促進中藥傳承創(chuàng)新,,建議如下:
在“十四五”計劃科技研發(fā)專項中,,盡快設立重大專項,支持大學和企業(yè)聯(lián)合開展“用顛覆性技術構建中醫(yī)藥AI大模型”重大系統(tǒng)化工程,,打造從底層中醫(yī)藥知識數(shù)據(jù)和實驗數(shù)據(jù),、中藥功能評價算法工具、中藥新產品開發(fā)智能平臺綜合解決方案的大模型賦能產業(yè)生態(tài),。開發(fā)符合中國人生命語言特點的原創(chuàng)中國藥,,用創(chuàng)新中藥守住中國人生命健康紅線。
(清華新聞網3月8日電)
記者:段穎
編輯:李華山
審核:郭玲