美国加州太平洋生物科学公司Michael A. Eberle小组实现了基因组尺度上串联重复序列的特征描述与可视化。相关研究1月2日在线发表于《自然-生物技术》。
研究人员介绍了串联重复基因分型工具(TRGT)和配套的串联重复(TR)数据库。TRGT可从PacBio HiFi测序数据中确定特定TR的共识序列和甲基化水平,它还能报告支持每个重复等位基因的读数。这些读数随后可通过配套的TR可视化工具进行可视化。在评估了937122个TR后,TRGT显示出98.38%的孟德尔一致性,并允许存在单个重复单位差异。
在6个已知重复扩增的样本中,TRGT检测到了所有的扩增,同时还识别出甲基化信号和嵌套,并提供了比现有方法更精细的重复长度分辨率。此外,研究人员还发布了一个数据库,其中包含100个基因组中937122个TR的等位基因序列和甲基化水平。
研究人员表示,TR变异与基因表达变化和许多罕见的单基因疾病有关。虽然长线程测序能提供准确的全长序列和TR的甲基化,但仍需要计算方法来分析整个基因组中的TR。
相关论文信息:
https://doi.org/10.1038/s41587-023-02057-3