谷歌“猜画小歌”隐藏了什么样的黑科技
你的朋友圈被一款名叫“猜画小歌”的微信小程序游戏刷屏了吗?就在前几天,当小编早晨醒来习惯性的刷了一下朋友圈,结果发现几乎所有人都在一夜之间成了“灵魂画手”,其火爆程度不言而喻。
出于职业敏感和强大的好奇心,我决定今天来扒一扒这个“猜画小歌”底,以及其背后的Google AI究竟在酝酿什么黑科技。
或许有的朋友不喜欢刷朋友圈,还不知道发生了什么。那么就先让我们来了解一下“猜画小歌”究竟是个什么鬼。
简单的说,这是一款通过手机来绘画的小游戏,玩家需要在游戏限定的20秒内完成要求的绘画,如果你的画作被AI识别成功,那么就算顺利达成。
“猜画小歌”的一夜成名引发了全球媒体的强烈关注。据CNN消息,Google正在尝试一种新方式来开拓中国市场。
据悉,“猜画小歌”由来自Google AI的神经网络驱动,该网络源自囊括超过5000万个手绘素描的数据群。Google产品经理Chris Tam在博客中说,这个游戏旨在让人们“有机会体验一下人工智能的交互现在是多么自然”。
谷歌早在去年就通过另外一种方式回归中国,那就是在北京成立了Google AI中国中心。
相信正是因为这样的契机,才会让我们中国的用户通过微信小程序这个途径,获得了这次“零距离”体验人工智能高科技的机会。同时也因为微信极强的社交属性,让这款小程序游戏能够在一夜之间火遍全中国,成为了轰炸朋友圈的利器。
好了,现在来划重点:“猜画小歌”这款微信小程序游戏来自Google AI,其技术核心是“超过5000万个手绘素描的数据群” 和“Google AI的神经网络驱动” 这两大关键。接下来我们就从这两个技术入手,看看Google AI正在酝酿着哪些黑科技。
首先,我们就从数据的部分入手,看看谷歌都从哪搞来这么庞大的图形数据库。
5000万手绘素描数据来自哪?
按照机器的运行逻辑,不难猜出“猜画小歌”的核心在于“数据”和“识别”这两大核心技术。
只要有了强大的数据库支持,然后再经过机器的筛选和识别,自然就能够轻松的识别出你画的是什么鬼东西了~数据库中的有效样本越多,那么识别的准确率也会越高。
其实这个道理也可以同样应用于人身上,你的阅历越丰富,那么你越容易做出正确的决定。
那么问题来了,Google AI的数据都是从哪里来?前文提及的“超过5000万个手绘素描的数据群”又是如何产生的呢?
其实早在2016年,Google就推出了一个网页版的《快速涂鸦》小游戏,但是由于中国大陆无法访问Google,因此关注的人并不多。
笔者也实际体验了一下这款网页版本的《快速涂鸦》,相比用手指在手机屏幕上作画,通过鼠标在网页作画的体验要差很多。
不过令人感到赞叹的是,当我的遥控器还没画完的时候,机器就已经非常快速的识别出,令人惊奇。
Google正是通过这个网页小游戏,让来自全球的玩家通过鼠标在网页上进行作画不断的完善数据库,以协助训练神经网络识别涂鸦。
按照《快速涂鸦》的网页提示,我们来到了涂鸦数据的大本营。在这里汇集了全球1500万玩家贡献的超过5000万份的涂鸦数据。
在Google看来,这些涂鸦是一个独特的数据集,可以帮助开发人员培训新的神经网络,帮助研究人员了解世界各地人们如何绘画,并帮助艺术家创造我们尚未开始思考的事物。
我们点开“apple”这个样本,会发现其实Google已经通过这个小游戏收集了139,898个有效的数据样本。
无论你是来自世界的任何一个地方,只要你见过苹果,那么苹果在你的意识形态中的样子基本不会超出这139,898样本之外。这也就解释了Google AI为什么能够如此快速的识别出你画出图形,因为这个数据库实在是太过于强大了。
我现在越来越理解AI为什么叫人工智能了,那就是赋予机器像人一样的逻辑和思维能力。而数据和决策,对人或者是对机器都是同等的重要。唯一不同的是,人有情感,而机器或许目前没有,至于以后,谁知道呢~
神经网络如何像人类一样思考?
解决了数据样本来源的问题,那么剩下的问题就是让机器来如何学习和分析这些数据样本,并最终做出决策。
关于“人工智能”这个词汇,其实我们都已经非常熟悉了,但是或许你很少听到“神经网络”这个词。而很多专业的人士认为,“神经网络”是“人工智能”发展的基石,比如模式识别、自动控制,以及最核心的深度学习都基于它。
那么神经网络究竟该如何理解呢?在很早以前,科学家们希望创造出能够像人类一样思考的机器。
经过研究发现,人类之所以具备思考的能力,其根本是我们体内的神经网络,而组成神经网络的个体就被称为神经元。科学家们大胆设想,如果能够制造出人工神经元,那么就能够制造出人工神经网络,从而让机器“深度学习”并像人一样“思考”。
提到“深度学习”这个关键词,其实你可以把具备人工神经网络的机器视为一个刚刚出生的婴儿,而婴儿的大脑里是一片空白。
婴儿通过不断的成长学习到更多的知识,并通过这些经历形成了独立思考和独立决策的能力。而机器在通过“深度学习”之后,也将具备同样的能力。
唯一不同的是,人靠的是大脑来进行思考。而机器是通过TPU对大量的数据进行分析和计算并通过建立的模型来做出最终的判断。
那么面对问题,人类是如何思考的呢?举个简单的例子,你正在为中午吃什么而发愁。
摆在你面前的是三个问题:①沙县小吃是否好吃;②沙县小吃远不远;③外面天气怎么样。
经过观察和思考你会发现:你喜欢吃沙县小吃,最近的沙县小吃有点远,外面天气不错。于是你纠结了,但你真的是个吃货,最终你决定:今天中午走远一点去吃沙县小吃。
和你不同的是,机器会把这一切都变成0和1来进行计算。
比如问题①沙县小吃好不好吃?答案是0代表好,1代表不好。机器通过采集到的数据对不同的问题进行判断,形成不同的0或者1。那么机器如何做最终的决定呢?
机器会把不同的问题加上一个加权值。比如你对口味要求高,那么问题“①沙县小吃是否好吃”的权重就更高;相反你不太在意距离的远近,那么问题“②沙县小吃远不远”的权重就会很低。
通过对不同问题分析和判断,并辅以加权值的复杂计算,最终机器会计算出一个结果:今天中午走远一点去吃沙县小吃。
就是这样,机器和你都做出了你认为十分正确的决定,而且都经历了“观察”和“思考”的过程。
唯一不同的是,你是通过大脑里神经元的微电荷来做出的决定,而机器是通过构建模型、大量数据的分析、对比、计算、加权……等一系列的复杂计算而做出的。