Google机器学习跨足天文、生物对我们的启示?简立峰:跨领

Google机器学习跨足天文、生物对我们的启示?简立峰:跨领
Google 又跨刀!没有天文背景如何助力 NASA

读者是否还记得去年度 INSIDE 曾报导过 Google AI 助力 NASA,发现了「迷你太阳系」,先前 太阳系 8 颗行星围绕太阳运行。但就在去年底,天文学家宣布在 2545 光年外有一个名为「克卜勒 90」的恆星,它周围有着同样数量的行星运转,如同另一个小型的太阳系。

由 Google Brain 和 NASA 突破性的天文研究,先前已刊登于《天文学杂誌》, Google Brain 研究团队资深软体工程师 Chris Shallue 今日透过视讯颇析机器学习 并 与我们分享研究过程。

人类从未停止过对宇宙的思考和探索,在 2009 年 NASA 克卜勒任务原先藉由克卜勒望远镜记录系外行星,从恆星前方经过导致的恆星亮度轻微下降现象,这种亮度下降信号可以让科学家们间接推算出行星的存在以及这颗行星的物理性质。

4 年间运作时间里收集了三万个可能的行星讯号。天文学家们运用自动化分析技术配合人工核对判读光图,但是问题来了,天文学家对其他数万个特徵不明显的讯号图肉眼几乎无法辨识,但在那其中,仍存在着未被所出的星体,于是人工智慧派上用场, 促成 NASA 与 Google Brain 合作。

在数万讯号理许多较弱的讯号同时也有较多杂讯,无法透过人工方式判别是否为

行星

套用先前在图像辨识上相当成功的卷积神经网路 ,利用 15000 个天文学家已人工标记的克卜勒讯号来训练模型,透过模型搜寻克卜勒资料库中的 670 个恆星,以此辨别新行星,最终在数量庞大的星体中发现 克卜勒 -90 i 和克卜勒 -80 g。

也许你认为,机器学习要执行不同专业仍有难度,从找到的比例来看 670 个恆星只找到了两颗新行星,比例远低于人类辨识出的,但回归到讯号複杂的光图来看,人类所能辨识的为曲线明显的,机器负责解决的是海量讯号微弱的数据,对天文学和工程师来说双方的合作的确带来突破性的发展,大幅降低人力耗损,甚至做到人类无法辨识的光图,他们的下一步是要运用模型运算整个克卜勒资料库中超过 20 万颗的恆星。

Google 机器学习多元跨领域 对台湾的启示

Google 在去年度机器学习系列媒体聚依序分享了医疗、翻译及 YouTube 影音如何透过人工智慧创新应用,今年第一场机器学习系列,他们揭示机器学习运用在天文领域的概念, Google Brain 跨领域的各项专案陆续为各产业带来创新应用,不过回归 Google Brain 的本质,他们是资工的背景,开发出新专案提升机器学习能力的目的为何呢?

简立峰在今日媒体聚特别提到值得台湾重视的两大要点,工程跨领域的贡献以及开发源码的重要性,事实上,研究团队从事不同专案目的不在对该领域的钻研,是希望能与这些产业也更深入的合作,过去普遍认为机器学习是资工人的课题,但如何突破神经网路就必须和其他领域接轨,一方面能带挹注该领域的产能,一方面也能藉由深入合作更加了解如何做出最有效的工具来帮助该领域人员。

台湾机会在哪?

今日除了天文学以外, Google也邀请到另一项 「基因测序」专案分享案例 ,新一代测序仪提供低成本、高通量的工具,但由于这些 DNA 读序相当片段 ,加上测序仪的结果有许多错误,因此 Google Brain 与生技团队合作开发提高基因组测序準确性的开源工具。

简立峰提到目前台湾在农产业有很好的根基,加上台湾新创在基因检测投入相当多,若能继续结合机器学习,将对是农业、病虫害问题都有很大的助力,可以透过开放工具让检测準确率更高 。

谈到 AI 马上让你想到複杂电脑运算或深奥的学习模型架构,不过随着技术开发,越来越多资源普世大众,包含近日 Google 旗下云端服务 Google Cloud 内加入 AutoML 的应用项目,让没有资讯背景的人能以更简单方式建立学习模型,套用在旗下服务内容,未来我们的人才将如何善用这些资源将是产业突破的重大转捩点。

相关推荐