蛋白质结构预测即从蛋白质的氨基酸序列出发,应用数学建模方法和计算机程序设计开发相应算法,通过所开发的算法构建蛋白质的空间三维结构模型。根据是否利用现有结构数据库中的结构作为模板信息,现有结构预测方法可大致分为两类:同源建模方法和从头预测方法。
蛋白质往往是通过与其他生物分子(称为配体)的相互作用执行其生物学功能,因此研究蛋白质-配体互作用对研究蛋白质的生物学功能具有重要意义。我们的主要研究包括两类:一是预测蛋白质-配体互作用位点,比如蛋白质-RNA/DNA (Su et al, Bioinformatics, 2019),蛋白质-辅酶A (Meng et al, Bioinformatics, 2018),蛋白质-多肽结合位点预测 (Zhao et al, JCIM, 2018);二是预测蛋白质-配体复合物结构。该图是实验室开发最新方法COACH-D的流程图。
单细胞测序数据能够提供单个细胞水平的基因组、转录组以及表观遗传等重要信息,对于更加深入细致的理解细胞功能至关重要。单细胞数据有着维数高、噪声大等特点。我们的研究关注于使用统计和深度学习等方法处理这些单细胞多组学数据,主要包括单细胞转录组和单细胞ATAC数据的去噪和聚类分析,基于单细胞转录组和ATAC的基因调控网络分析,单细胞空间转录组数据分析,单细胞3D基因组数据分析等。