行業資訊
行業資訊
“數據要素×”典型案例之十三 | 高質量藥物數據集提高新藥研發質效
日前,國家數據局會同生態環境部、交通運輸部、金融監管總局、中國科學院、中國氣象局、國家文物局、國家中醫藥局等相關部門在第七屆數字中國建設峰會上發布第一批20個“數據要素×”典型案例,通過示范引領,激勵多方主體積極參與,釋放數據要素價值。
提升創新藥自主研發能力關乎國家生物醫藥產業轉型升級,也與國家生物安全自主可控、國民生命健康緊密相連。高質量藥物數據在新藥研發的過程中至關重要,目前國內藥物數據來自不同細分領域的學術數據庫,存在流通不暢、資源分散和標準不統一等問題。北京市計算中心有限公司通過多渠道、合規收集海量藥物研發關鍵數據,建立專業的新藥研發數據集,進行智能化分析和數據挖掘,有效降低新藥研發周期,賦能上百個新藥研發項目。
一是多渠道收集藥物研發數據。通過公開數據庫下載、文獻信息整理、公開渠道購買等多種方式,收集藥物相關的分子結構、理化性質和靶點信息等藥物研發關鍵數據,并通過計算機輔助和人工校驗確保數據質量可靠,為科研人員提供了較強的數據支持,明顯提高藥物研發的準確性、可靠性和實用性。
二是建立高質量新藥研發數據集。對匯聚數據進行統一處理,形成能夠支撐藥物數據研發的高質量數據集,該數據集包括小分子、多肽和蛋白靶點數據,其中小分子和多肽信息400余萬條(幾乎覆蓋當前全部藥物數據領域),潛在的藥物活性位點超過11萬個。
三是智能化分析和挖掘數據。基于人工智能算法對藥物數據集進行數據挖掘和藥物特征提取,形成疾病相關的藥物有效特征,為新疾病靶點預測和對應藥物研發提供準確、個性化、智能化分析服務。目前已與全國30余家高校和科研院所開展合作,利用高質量藥物數據集和智能服務開展的新藥研發項目100余項,人工智能預測靶點超1萬余個,基本覆蓋了已知疾病。
圖 與北京某高校合作,針對已知藥物的靶標確認展開研究