Google 发布了一款 AI 工具帮助基因组数据解读

互联网 | 编辑: 潘翔城 2017-12-07 09:17:05转载

距离科学家们首次人类基因组测序已经 15 年了，而如何使编码人类生命的庞大基因组数据变得有意义依然是一个艰巨的挑战。但是，这种类型的问题恰好是机器学习所擅长的。

距离科学家们首次人类基因组测序已经 15 年了，而如何使编码人类生命的庞大基因组数据变得有意义依然是一个艰巨的挑战。但是，这种类型的问题恰好是机器学习所擅长的。本周一，Google 发布了一个称为 DeepVariant 的 AI 工具，使用最先进的 AI 技术，能够从测序数据建立了一个人类基因组更精确的谱图。

图片来源：MIT technologyreview

DeepVariant 帮助高通量测序读数转化成为一个全基因组图谱。它能够自动鉴别测序数据中小的插入和缺失突变，以及单个碱基对的突变。

高通量测序逐渐成为广泛的应用，使得基因组测序更为简便。但是，使用这样的系统所产生的数据仅仅提供了一个有限的、容易出错的全基因组快照。通常，对于科学家们来说，将那些小的突变与测序过程中所产生的偶然错误区别开来，是有挑战的，尤其是在基因组的重复部分里。这些突变可能会直接与例如癌症这样的疾病相关。

现在，存在一些可以解读这些读数的工具，包括 GATK、VarDict，以及 FreeBayers。然而，这些软件程序通常使用更简单的统计和机器学习方法，通过尝试排除读取错误来识别突变。

“挑战之一是，在基因组的困难部分，每个工具都会有它的长处和短处，”Brand Chapman 谈道。他是哈佛大学公共卫生学院的研究科学家，帮助开发了 DeepVariant。“这些困难的区域对于临床测序的重要性在增长，以及对于获得多重方法来说也是重要的。”

Chapman 与来自 Google Brain 团队的研究人员合作。GoogleBrain 团队，这个团队专注于 AI 技术的开发和应用；另一个 Alphabet 子公司专注于生命科学；DNAnexus 是存储基因组数据的云平台，Andrew Carroll 担任 DNAnexus 的副总裁。

在一个名为 Geneome in a Bottle（GIAB）的项目中，团队收集了数以百万计的高通量读取以及全基因组测序。GIAB 项目是一项公私合作的项目，旨在推广基因组测序工具和技术。他们将数据提供给深度学习系统，并刻意调整模型的参数，直到它可以学会以一个高水平的准确性解读测序数据。

去年，DeepVariant 在 PrecisionFDA Truth Challenge 中赢得了第一名，这是由 FDA 发起的比赛，旨在促进更加精准的基因测序。

“DeepVariant 的成功很重要，因为它表明了在基因组领域，深度学习可以用来自动训练系统，其表现优于复杂的手工操作系统，”Deep Genomics 的首席执行官 Brendan Frey 表示。

DeepVariant 的发布是机器学习有望推动基因组学进步的最新标志。

Deep Genomics 是尝试通过 AI 方法（例如深度学习）梳理出疾病的发病基因以及鉴别出潜在的药物治疗的少数几个公司之一。

Frey 表示，AI 将会逐步变得更好，不仅仅帮助分析基因组数据。“目前阻断药物（开发）的缺口在于我们无法准确地将遗传变异与疾病机制进行对照，并能够利用这些知识快速确定拯救生命的疗法。”

DeepVariant 也会在 Google 云平台上提供给用户使用。Google 和它的竞争对手都在将机器学习功能添加到他们的云平台上，以吸引任何想要使用最新的 AI 技术的人。

总的来说，在未来几年，人工智能数据将有助于医学的许多方面取得巨大的飞跃。AI 有很多机会可以从图像或医疗记录中挖掘出许多不同种类的医疗数据，比如，预测出那些人类医生可能会错过的疾病。

基因组医学代表着一个尤为重大的机遇，因为数据的规模和复杂性是前所未有的。“在历史上第一次，我们测量生物体的能力，以及对它操作的能力，都远远超过我们理解它的能力，”Frey 说。“AI 是我们解释和处理海量数据的唯一技术。这将彻底改变医学的未来。”

每日精选

LOGO水印全改了小米17 Ultra徕卡全球版变化大

小米将在2月28日推出针对海外市场的小米17 Ultra徕卡版。目前，X平台爆料者已经放出了该机的真机照片与实拍样张，该机在设计细节上与国行版存在明显差异。

标签：小米| 小米17Ultra| 徕卡版| 全球版| 2026-02-24
成本抗不住 REDMI Turbo 5 Max 1TB版不补货

REDMI产品经理张宇声称，REDMI Turbo 5 Max 1TB版本备货极少，卖完就没了，如果真想买，可以线下门店问问，可能个别门店还有点库存。

标签： REDMI| REDMITurbo5Max| 1TB| 2026-02-24
曝国内厂商跟进测试防窥屏 9月新机首发搭载

据渠道消息透露，国内厂商已经跟进防窥屏，已经开始对这种屏幕进行测试，预计最早在9月份，就会有搭载防窥屏的新机进入市场。

标签：三星| GalaxyS26Ultra| 防窥屏| 国产| 2026-02-24
荣耀MWC发布会3月1日启幕两款重磅机型亮相

荣耀手机官方透露，荣耀MWC2026全球发布会将在3月1日正式启幕。荣耀Magic V6旗舰折叠屏手机将会在此全球首发，荣耀ROBOT PHONE也会进行前瞻亮相，更有众多新品与前沿科技重磅登场。

标签：荣耀| 荣耀MagicV6| 荣耀ROBOTPhone| MWC| 2026-02-24
一马平川无折痕 OPPO Find N6官宣即将登场

2月24日，OPPO官方宣布新款折叠屏旗舰OPPO Find N6即将登场，在同步发出的海报中，特别强调了屏幕的“一马平川”。

标签： OPPO| OPPOFindN6| 无折痕| 2026-02-24
英特尔拟推统一核心架构，或将于2028年终结大小核设计

英特尔近期招聘信息显示，其正组建统一核心设计团队研发全新CPU微架构，这意味着英特尔或从2028年左右，逐步放弃自12代酷睿沿用至今的大小核异构设计。

标签：英特尔| CPU| 2026-02-24
首创双效洗地石头洗地机A30 Pro Steam 2.0上市

石头科技推出了石头洗地机A30 Pro Steam 2.0，以更具颠覆性的180℃活性蒸汽系统，将家庭深度清洁推向“健康可守护”的新阶段。

标签：石头洗地机| A30ProSteam2.0| 180℃活性蒸汽| 2026-02-24
石头扫地机P20 Max上市发售复杂环境长期可靠

2026年2月24日，石头科技发布全新的全能旗舰——P20 Max。作为石头年度爆品P系列的最新一代自清洁扫拖机器人，P20 Max围绕复杂家庭结构与高频真实场景进行系统级重构。

标签：石头科技| 石头扫地机P20Max| 发售| 2026-02-24
英特尔Bartlett Lake-S阵容曝光，采用罕见的纯性能核设计

英特尔Bartlett Lake-S系列处理器阵容曝光，采用罕见的纯性能核设计，但其定位明确指向工业与边缘计算领域，属于酷睿200E系列；虽沿用LGA-1700接口，但主板厂商未提供BIOS支持，消费级平台无法使用。

标签：英特尔| BartlettLake-S| CPU| 2026-02-24
京东3C数码开工季：一站式购齐电脑手机和智能手表

京东3C数码推出开工开学季促销，涵盖电脑、手机、耳机等多品类产品。用户可搜索“3C开工开学季”，享受以旧换新补贴、国家补贴、教育优惠等多重福利，以优惠价格焕新装备，助力高效开启新年。

标签：京东| 3C| 电脑| 手机| 手表| 2026-02-24