

肖传乐
简介
生物信息学博士,广东省杰出青年基金获得者,生物工程学会计算生物学与生物信息学专委会副主任委员,、长期致力于生物大数据方法开发及应用研究,近年来针对三代测序基因组学和表观遗传学基础研究及应用的计算瓶颈问题建立了系列关键算法和支撑软件。主要研究成果有:1)提出了长序列种子投票打分模型(Nature Methods)和精度优先序列校正模型(Nature Communications),开发快速组装系统MECAT和NECAT系统,大幅提高组装计算速度;2)提出了PacBio甲基化并行计算模型,首次系统揭示了人类DNA-6mA甲基化图谱(Molecular Cell);3)建立了识别动物甲基化(CpG)和植物甲基化深度学习模型,实现了动植物5mC精准检测(Nature Communications)。目前主持省部级以上项目10余项,其中国家自然基金4项,国家重点专项骨干2项。
代表性论著
1、MECAT: fast mapping, error correction, and de novo assembly for single-molecule sequencing reads.Nature Methods, 2017.11, 14(11): 1072~1074.
(第一兼通讯作者,47.99,中科院分区表大类一区)
2、N6-Methyladenine DNA Modification in Human Genome. Molecular Cell, 2018.7.19, (71): 306~318.(第一作者,19.32,中科院分区表大类一区)
3、Efficient assembly of Nanopore reads via highly accurate and intact error correction. Nature Communications 2021,12(60):1-10.(最后通讯,17.69,中科院分区表大类一区)
4、Detection of DNA base modifications by deep recurrent neural network on Oxford Nanopore sequencing data. Nature Communications 2019, 10(1):2449.(共同通讯倒数第二,17.69,中科院分区表大类一区)
5、Genome-wide detection of cytosine methylations in plant from Nanopore data using deep learning. Nature Communications, 2021, 12(1): 5976.(共同通讯倒数第三,17.69,中科院分区表大类一区)
代表性成果
1.国家自然科学基金面上项目,32270713,高阶三维基因组数据单倍型分析方法研究,54万,2023.1-2026.12,在研,主持
2.国家自然科学基金原创探索计划项目,62150048,单倍型群体基因组组装及其疾病关联分析方法研究,285万(分40%),2022.1-2024.12,在研,合作主持人
3.广东省自然科学基金杰出青年项目,2020B1515020057,纳米孔测序数据分析核心计算方法研究,100万,2019/10-2023/9,在研,主持
4.国家自然科学基金重大研究计划,91953122,基于纳米孔电信号腺嘌呤N6甲基化修饰识别方法研究及应用,60万,2020/01-2022/12,在研,主持
5.国家自然科学基金面上项目,31871326,基因组启发式三代测序校正方法研究及应用,59万,2019/01-2022/12, 在研,主持