记者19日从天津大学获悉,该校应用数学中心的吴华明教授团队在DNA存储领域取得突破,团队提出了一种全新的DNA存储系统——HELIX,专门用于存储生物医学数据,并成功实现了60MB的时空组学图像的存储与恢复。研究成果发表在《自然·计算科学》上。
随着信息技术的飞速发展,传统存储方式逐渐无法满足大数据时代的需求。在此背景下,DNA信息存储技术应运而生,利用DNA分子存储数据,被视为未来大规模数据存储的解决方案之一。
每克DNA能够存储数百艾字节的数据,并且在无需电力的情况下能够保存长达数千年。尤其在生物医学数据领域,DNA存储的潜力尤为显著——其图片数据分辨率高、存储周期长且相似度强,具有巨大的应用前景。
吴华明介绍,研究团队开发的HELIX系统包含3个核心模块:图像压缩、图像纠错编码和图像复原。针对DNA存储过程中可能出现的碱基错误,HELIX对现有压缩算法进行了优化,大幅增强了系统的容错能力。同时,为了进一步提升图像解码的成功率,团队还引入了深度学习技术,在图像修复过程中显著增强信息恢复的能力。
在湿实验中,研究团队成功将两张60MB的时空组学图像编码为13万条、每条183个碱基的DNA序列,并通过DNA合成与测序技术,恢复了图像数据。实验结果表明,HELIX系统具备强大的鲁棒性,只需要约5.8倍的测序深度,即可恢复图像的绝大部分信息。
据介绍,该成果在推动DNA信息存储技术走向实际应用方面迈出了重要一步。这个针对特定数据类型量身定制的DNA存储系统,不仅在存储效率上表现卓越,还在可靠性方面展现了更大的优势,为DNA信息存储技术的广泛应用奠定了坚实基础。
(原标题:我学者提出全新DNA存储系统 )