三个例子告诉你们基于动力学的数据科学在生命科学中的应用

21世纪以来,生物大数据在量(多数据种类,海量样本数,多时间点采样等)、质(高时空精度,单细胞测序等)两方面快速发展,大大推动了生命科学的进步,也为生物医学问题的模型建立、数据分析,以及预测和控制,带来了巨大的机遇和挑战。
传统的生物学数据研究方法大多基于数据的静态统计信息,即“基于统计学的数据科学”(statistics-based data science),其缺点是,在很多场景下不能准确地解释和预测系统的复杂动态行为。数据分类、数据降维、变量聚类、变量相关性分析等方法都是如此。
然而,即使是静态的数据,往往也蕴含着系统的动力学特征。我们需要通过“基于动力学的数据科学”(dynamics-based data science),充分建立和利用动力系统的普遍性质(如,稳定平衡点的临界性质、中心流型的低维性、单变量的吸引子的重构性等),对蕴含在数据中的动力学信息进行挖掘和分析。 
“基于动力学的数据科学”将动力系统理论、统计学理论,和数据的实际背景结合在一起,为处理和解释动态生物大数据提供了一种基础坚实、计算高效的理论和方法。 
在最近发表于《国家科学评论》(national science review,nsr)的观点文章中,中科院生化细胞所的陈洛南研究员(通讯作者)、东京大学的史际帆博士(第一作者)和aihara教授通过3个具体实例,揭示了如何利用动力系统的普遍性质,由观测的数据对生物学现象进行动力学分析,并解决生命科学的实际问题。1.   利用微分方程的分岔理论,由测量的高维数据,进行健康临界预警和疾病预测。dnb理论利用了系统在临界点附近,复杂网络将表现出有别于非临界点的网络特性,量化临界状态并发现疾病的关键因子,实现疾病预警“防病于未然”。
2.   利用偏微分方程和diffusion map理论,量化细胞的多潜能性或距离干细胞的远近。ldd方法是,通过建立随机生灭过程的偏微分方程模型,对细胞的分化过程进行了多潜能性量化。利用单细胞测序数据和相关数学方法,可以对每类细胞多潜能性进行估计和分化程度排序,实现量化细胞的多潜能性,并构建多潜能性势能景观。
3.   利用神经网络工具,对基因表达量等的时间序列进行预测。arnn方法是,利用最新的reservior神经网络工具,通过“空间-时间信息变换方程”sti,即变换高维数据的信息为时间的动态信息,对短序列高维度数据(如基因表达数据)进行学习,可实现复杂系统的短时间序列或动态演化的预测。
“基于动力学的数据科学”是一个全新交叉领域,相比传统静态的“基于统计学的数据科学”方法,具有“可解释性”、“可量化性”和“可拓展性”,在今后的生物医学等领域的研究舞台,将扮演不可或缺的重要角色。


腾讯云和 NVIDIA 联合推出赋能中小企业的扶持计划
影响荧光灯寿命的因素
进步的AI技术,糟糕的“伪”智能
众测一致好评—24W充电器ic U6147D
华为公开“半导体器件”专利:提升场效应晶体管电流驱动能力
三个例子告诉你们基于动力学的数据科学在生命科学中的应用
工信部无线电管理局局长谢远生介绍了5G频谱政策制定的有关情况
中微半导体自主研制的5纳米等离子体刻蚀机获台积电验证
应对5G网络安全问题的四大措施
荣耀赵明:高通、联发科等所有的供应链伙伴已经全面恢复对荣耀的供应
这种TF变SSD的转换卡,靠谱吗?
目前全球的智能网联市场上,行业的标准化依然是首当其冲的任务
零售巨头亚马逊利用人工智能算法设计服装
微软供应商暗示:HoloLens二代或正研发
小米预告屏幕新突破:可折叠手机终于成了?
3D电视打破传统 彩电业上演3D产业链整体切换
电量计开发套件BQstudio简介
人工智能无人便利新零售
艾迈斯欧司朗数字温度传感器如何应对体温监测复杂挑战
硬件或成移动支付下半场“主旋律”?