4月9日凌晨,《我是歌手》总决赛以李玟夺冠落下帷幕,这一次,成为媒体焦点的不只是李玟,还有成功预测了决赛最终结果的阿里云人工智能程序小Ai。
不同于以往还停留在冰冷的规则与逻辑层面的科技产品,小Ai是基于神经网络、社会计算(social computing)、情绪感知等原理工作,能展示人工智能在艺术和理解人类情感领域感性的一面。
说白了,小Ai就是一个超级聪明的机器界学霸,要命的是它还善解人意。它像吃哆啦A梦的面包一样把多个领域的知识、数据都吞了进去,然后用快速的计算能力给出一个最恰当的结论,同时,它还尝试着去理解人类,把对人类的情感分析作为最终结果的其中一项参考。
随着小Ai的走红,科技能否取代人类这个命题也再一次被大众提上议程。且不论结果如何,但想必包括研发者本人在内的所有人都无法接受自己被取代这个事儿。
“人毕竟是有主观性的,而小Ai没有属于自己的情绪。这也是机器冷酷的地方,以一种无情的方式去诠释一种有情的过程。” 阿里云人工智能科学家、“小Ai之父”闵万里博士在接受媒体采访的时候说道。
《我是歌手》结束后,闵万里就小Ai这款产品接受了媒体的采访,以下为其口述整理:
小Ai凭啥可以预测谁是冠军?
问:为什么会选择用音乐作为小Ai展示的窗口?
闵万里:首先,《我是歌手》这档节目本身的影响力足够大。其次,节目充满了随机性和不可控因素,比如说歌手的临场发挥、选曲、编曲如何,大众评审的喜好等,在预测上存在一定难度。我们想要证明人工智能,所以自然选择挑战最难的。
选择音乐领域的另外一个考量是,传统的计算机向来是机械的执行指令,由零和一组成的一个冰冷的世界,考验的是逻辑思维。而音乐不一样,它是一个纯感性的东西,拥有情感世界的复杂性。
先不说机器是否有情感,第一步是能否理解感情,也就是理解我们一个人对一个事物判断的情绪的认知。这是对于小Ai的另一个挑战。
问:小Ai如何提升自己的“音乐品味”,并且是根据哪些因素来预测歌王的?
闵万里:首先,离线系统操作,用阿里音乐海量的音乐库来培养“音乐的品味”。我们的数据会透析阿里音乐内每一首歌曲的下载量、点击量等,这同时反映了这些歌曲受欢迎的程度,当我们把受欢迎的程度跟歌曲的一些音频特征以及谱曲等音乐因素进行关联的时候,小Ai就学会了一些鉴赏音乐的基本的能力。
其次,实时采集歌手的现场发挥和表现。通过测量歌手声音中的音域、能量、音高、音准等,就这些维度进行深度学习。
再次,社会大众对于歌手的实时反应是另一个信息渠道,比如说演唱时收视率的突然变化,另外还包括社交网络上大众的点评上升的多少也具有一定指向性。
最后,现场因素。比如是否有用特殊的乐器伴奏,伴唱的人数等。
小Ai会结合这些综合因素做实时解析,然后输入到计算模型中,每五秒钟更新一次计算结果,实时的计算每一个选手最终得冠军的概率,基于这个概率从高往低进行排序就能得出名次。
小Ai的预测是基于阿里云的大数据平台,其中几个核心系统是:
爬虫系统实时分析互联网上关于歌手的评论变化;情绪分析对互联网上关于选手的评价好坏做文本处理;现场采集音频数据、舞台特效数据等进行实时解析,以此来判断歌曲的好坏程度。
小Ai的本领是怎么炼成的?
问:谷歌、百度都在提深度学习这个概念,阿里的深度学习和它们的差异在哪里?
闵万里:其实我们在讲的是同一件事情。早在1990年的时候,就已经提出了深度学习的概念,但因为计算平台不够所以一直没有得到大规模应用。直到2006年一些应用的出现,使之成为了一种趋势。有了谷歌、亚马逊、IBM等大公司云计算的支持,使深度学习不再有障碍。
与其他公司不同的是,阿里不是为了深度学习而深度学习。对人的情感尤其对感情思维的判断不需要那么深入的解析,而是全方位的思考和观察。如果信息源是错误的,哪怕再深度学习,也还是以偏概全,就像以管窥豹一样,我们要做的是把管拿掉,看到全貌。
问:微软的数据达人一个是天气公司一个是社交数据,阿里的人工智能用什么资料来训练?
闵万里:微软当初训练的时候缺乏学习资料,所以把大英百科全部扫描了一遍,包括学术内容。今天的小Ai也面临同样的问题,但好在阿里有生态优势。
但如果要跨界到其它领域,比如天气预报或水库水位方面,则需要精准的降水和预测,仅仅依靠公开的天气网络数据或自己采集,只能拿到一些比较粗的分辨率,会大大影响效率,所以希望在数据开放这块可以走的更快一点。
问:小Ai的学习速度是什么样的?
闵万里:小Ai的学习速度是非线性增长的。一方面,从计算架构上来说,我们不会给它灌输更多的学习资料,随着计算能力的提高,阿里云的架构是常年在升级的,所以它自我更新的速度也会快很多。另一方面,从学习资料上来说,如果灌输给它更多的学习资料,可以发现更多坑的时候,每一步的选择变得更加智慧,所以这样坑越多的时候,它的选择则更聚焦,所以会非线性增长。
小Ai的用途有多广?
问:小Ai之后会变成硬件对外提供吗?
闵万里:我们会尽量避免把它做成一个硬件,因为小Ai做成硬件可能会很昂贵,老百姓消费不起,从另一个角度来说,很多功能对于大众来说是用不到的,这也构成了一种浪费。所以我们的理念很简单,就是运用整个阿里云的设施架构服务每个人,大家只是购买小Ai的服务,而不是买一个机器。
问:小Ai下一步推广到哪些应用或者哪些范围?
闵万里:目前,小Ai已经在部分范围内成功落地了,包括交通堵塞问题、太阳能发电预测、帮助金融机构自动接听电话、分析客户投诉等。
长远来看,小Ai会在影视娱乐领域长久深耕。就制作层面来说,小Ai可以帮助编剧根据剧本选配合适的角色,客观的给出各个角色的选角推荐;在投资层面,可以帮助影视投资公司及制片人关于影片的票房价值;在营销层面,可以帮助影视公司做精准营销,比如在哪些地方投放广告最有效。
健康领域同样也是小Ai服务的重心。中国在慢慢进入老年化社会,很多老年性疾病在以前一直没有被重视,所以我们会持续把人工智能的技术用在医疗数据,尤其是病例部分的深度挖掘上,帮助消费者主动发现一些隐藏的潜在疾病,做到早期就把疾病预判出来,减少拖延所带来的后果。
接下来,小Ai还要往幸福、快乐这两个方向去服务大众,包括独居用户的情感慰藉,这是另外一个想象空间。
问:小Ai实践的目标还有哪些技术上的难点需要突破?
闵万里:如何识别信息的有效意图是技术上的一大难点,即对于发出指令者的意图猜测,这往往需要一个连贯的场景去帮助它识别,而难点就在于对上下文的采集上。比如你只是问一句你猜我心情怎么样,但它并不知道你刚刚经历了什么,也就无从判断。
另外,在医疗领域当中,还有太多的问题需要攻坚。第一,由于历史原因,医疗数据的很多历史样本是非公开的,所以小Ai学习不到。第二,医学本身是非常复杂且庞大的领域,小Ai要恶补很多知识,这离不开医学专家的指导,而科技出身的小Ai与传统医院的专家们必然存在较大的间隙,这是另一个难点。