您现在的位置是: 首页 > 通信

明明有不少技术亮点,罗永浩为啥一句人工智能也没提

时间:2017-05-15 15:37:29 来源:新浪科技

  欢迎关注“创事记”的微信订阅号:sinachuangshiji

文/允中 来源:量子位(QbitAI)

罗振宇:有没有人认为罗永浩是一个外行?

罗永浩:第一代硬件发布会的时候,有人说你懂个屁手机。我不懂人工智能,人家问,我就聊了。有人就说你聊什么人工智能,你还是说相声去吧。

罗永浩这次一句“人工智能”也没提。

上周,锤子科技新款手机发布。照例,有褒有贬。关于手机本身,量子位不想过多评论,我们更关心期间展示的一些人机交互方式。

罗永浩谈论的很多“软性”卖点,招招式式全跟AI有关。

这位锤子科技创始人的观点是:如果一个全知全能的“语音助手”还不能实现,那就先通过工具性产品提升用户效率。

去年10月,也是锤子的一场发布会,突然让科大讯飞火了一把。这次锤子新产品背后,又是哪些人工智能公司在支撑?

AI伙伴

在坚果Pro发布会上,锤子科技在手机上的AI变革,一目了然。

首先可以从系统层面来看,锤子的打法是通过系统功能,让锤子手机用户在具体场景中体验更好、效率更高。其次是工具性产品打造,通过工具性产品,解决用户核心痛点和改善用户体验。

这些应用的背后技术方案提供商,也无一例外来自人工智能领域;而软件交互方面的创新,都与人工智能最新进展密不可分,在此量子位一一拆解挖掘:

1)短信退订

“短信退订”背后的技术提供商是小源科技,这是一家垂直于短信、利用语义分析场景、建立机器模型的公司,他们更加为人所知的产品名称是“信析宝”,主要应用形式是将航班信息等短信卡片化——更美观、更实用、并且可以直接跳转到相关App。

不过,这一次放在锤子科技发布会上展示的是“短信退订”的问题,这是目前短信骚扰最头疼的问题之一,而锤子和小源的结合,则为功能式解决首开案例。

小源科技负责对外战略合作的合伙人段旭告诉量子位,“短信退订”背后主要涉及的是“自然语言理解”和“场景识别”等两大内容。

首先是“自然语言理解”,即通过机器“读取”短信内容,判断短信内容、类型和所属场景。

其次是“场景识别”,需要判断短信是一般退订短信,还是带有通知内容的退订短信,再在用户最终决策后,一键完成退订,并且不会给发送短信方造成“回复证明活跃”的现象。

小源方面称,这背后是短信内容大数据的积累,以及内容场景模型的精准构建。

2)虚拟来电

“虚拟来电”是发布会会中和会后受到争议的功能,在“道德与否”的问题上,引发了广泛讨论。然而就技术而言,这已然是人工智能领域相对成熟、且被广泛应用的技术。

具体提供商方面,锤子引用了科大讯飞的“配音阁”,这是讯飞主打语音合成方案的平台名称,该平台可以按需提供个性化语音合成,能够通过简单而基本的语料信息,合成具体语言、具体语种和具体个人口音的语音信息。

更早之前,在锤子科技去年10月的新产品发布会后,科大讯飞的“配音阁”已经在锤子科技系列新产品发布会前后大放异彩,主要是通过合成罗永浩、奥巴马等的口音,实现机器语音的“个性化”。

值得关注的是,虽然锤子科技功能化产品“虚拟来电”受到争议,但该技术的实际应用却广泛得多。

例如现在不少快递企业,已经在通过“虚拟来电”的方式,让机器来通知物流快递信息,而一些售后和客服任务较重的行业,也已经上马了该技术。

这也是客服行业和配音行业正在经历的大变革。

除了科大讯飞,宣布AI转型的百度也在这方面秀过肌肉,在2016年百度世界大会上,李彦宏就展示过人工智能充当客服带来的效果,不但成本降低,而且准确度,以及对用户非结构化数据的整合方面,效果都极其明显。

此外,就着当红演艺明星胡歌的面,李彦宏还让机器模仿胡歌的“口音口吻”,除了感情色彩上稍逊一筹,已属惟妙惟肖——李彦宏说,人工智能正在抢走配音师的饭碗。

3)智能语义拖拽

当然,锤子发布会听起来最具普惠意义的莫过于“智能语义拖拽”,这是一个高速公路一样的功能,在分割林立的手机App之间架起直通管道,减轻App间切换的痛苦,同时提升手机使用效率。

具体来看,“智能语义拖拽”就是把微信、短信等对话过程中产生的信息进行分析,按照所属直接在地图导航、美食评价和日程日历等产品中使用。

但值得关注的是,锤子最终展现的“智能语义拖拽”是一个一步到位的功能,用户可以直接将一段文字拖入相关App中,而机器会在该过程中分析信息内容、提取核心相关信息、并且让各个App各司其职——快速帮助用户完成目的。

实际上这个过程中,锤子还进一步整合了上次推出的“大爆炸”和“一步”两大功能。

此次智能语义拖拽背后的技术提供方是三角兽科技,这是这家初创公司第二次出现在锤子发布会上,上一次双方合作的产品是“Big Bang”(大爆炸)。

据量子位了解,主打智能语义分析三角兽,在该功能从无到有诞生的过程中,总共向锤子科技派出了3名工程师,共计耗时3个月,最大挑战来自手机场景下的技术方案落地问题——在此之前并没有厂家做出过尝试。

三角兽技术负责人称:智能语义拖拽涉及的是NLP中最核心最具挑战的问题,通俗来讲就是让机器断句,且学会中文语境下的“预感”,进而才能搭建机器学习模型。

不过,在和锤子一起开发“智能语义拖拽”的过程中,最大的挑战来自如何在手机场景下,最低限度降低机器模型对CPU、计算功耗等方面的消耗。

而且作为一个功能型产品,还需要考虑联网和本地两种交替情况下如何保证速度,因为反应速度会直接影响用户体验。

“更倾向于合作方是使用网络版的接口,但因为手机涉及用户隐私,或网络情况不佳,就可能需要用到离线版本。

然而紧接着需要解决的问题是离线版本对系统资源的占用,此外运算速度如果太长就会比较伤害用户体验。”三角兽工程师说,同时表示这是最大的考验。

然而,这个最大考验解决后,获利方也将最大化。

在锤子方面的合作实现后,三角兽工程师也坦言,可以无障碍适配到更多的手机产品中。

虽然之前并没有其他手机厂家拥有这样的需求,但在此次坚果Pro的合作中,三角兽和锤子一起完成了从最低配版本的坚果手机,但最高配版本的旗舰机M1L的适配——迁移的成本已经很小了。

这也意味着,一旦其他手机厂家跟进迁移该功能,未来大量涉及不同应用间切换的内容,都将变得 so easy,例如微信中约定吃饭的时间地点,同时将内容拖拽入“日历”、“地图”和“大众点评”等应用中即可。

4)闪念胶囊

“闪念胶囊”是个新鲜事,但伟大的是解决问题的出发点,而非实现的技术难度上。

坦白讲,这只是一次“语音备忘录”和“语音识别”的功能综合,但正如罗永浩所言,近年来,并没有人为此付出过实际性举动,并且难能可贵的是,锤子将通过开源,让跟多非锤子手机用户也能使用。

这也是锤子AI工具产品思路中的集大成之作。除了语音识别,“闪念胶囊”背后还应用了智能语音拖拽、大爆炸和一步。

在接受量子位的采访中,科大讯飞方面的负责人表示,此次也在“闪念胶囊”中和锤子进行了协作,主要涉及语音识别方面。

与“智能语义拖拽”面临的问题相似,“闪念胶囊”最大的问题是如何在手机设备下实现对资源的合理调用。

如罗永浩发布会上所言,最后锤子和讯飞给出的方案是:首选联网识别,但如果网络情况不佳,则先使用讯飞语音识别本地方案,再在网络情况良好时联网修正。

语音识别和自然语言理解

不难发现,锤子新产品发布会上重点推出的工具产品/功能,背后的主要技术是语音识别和自然语言理解及处理,这也是目前人工智能最成熟、进展最快的两大领域,也是中国人工智能公司全球领先的领域。

语音识别方面,从科大讯飞、百度,到搜狗,都已经在大语料数据库的基础上,将语音识别的准确率提升到了97%以上,这在国际公认的标准参数都已然处于领先,并且讯飞还实现了方言领域的高识别率,可以说这是锤子可以实现一系列语音交互为基础的产品的底气所在。

通常情况下,相比键盘为代表的文字输入,语音要高效很多。这也是目前最被看好的新一代人机交互技术,包括亚马逊、Google、微软、百度和讯飞在内的公司,都在积极推动语音识别为核心的交互平台的运用,希望自己的语音交互平台,会成为下一个iOS、下一个安卓。

自然语言理解方面,百度的度秘、微软的小冰,以及三角兽等为代表的创业新势力,都已经取得了不俗的进展。无论是小冰的聊天,百度的“读”新闻,三角兽的中文断句,都在自然语言理解、自然语义处理方面,为锤子的产品式整合扫清了障碍。

可以说,这是人工智能进展给于锤子的机会,但同时也是手机行业正在经历的技术变革——与芯片、工业设计等硬件大战不同,这一次革命将体现在“软件”上。

智能手机正迎来新时代

今年3月,量子位曾有文章称《没有人工智能的硬件,未来可能不配叫智能硬件》,当时三星新旗舰Galaxy S8发布会上,安卓阵营巨头推出了人工智能助手Bixby,这是一个类似苹果Siri的产品。

同时也是罗永浩所称的全局性解决问题的语音助手产品,即便他暂时不看好,也已经赛道密集潮水汹涌。

在国内,华为率先在国产手机中推出了语音助手产品“小E”,让用户用自然语言的方式,向它求助在手机使用过程中遇到的各种问题,但具体使用情况来看,用户需求度还不高,场景尴尬的问题始终没有得到解决。

此外,另一种利用AI全局性解决问题的产品是“系统优化”,通过个性引擎,在用户使用习惯的基础上形成用户画像,然后在使用过程中实现“预判”和“推荐”。

例如从EMUi5.0系统开始,华为便开始对外宣称手机系统能够学习用户的操作行为,通过这种方式,系统将可以实现对用户操作的提前预判,依此进行资源的合理分配,从而为用户带来更加顺畅的体验。

同样方向出发的还有魅族。这家总部位于珠海的手机厂家,在2016年年底伴随手机系统Flyme6推出了“One Mind”,这是一个通过用户画像帮助手机用户完成分析、决策的内置程序,最突出的亮点是帮助CPU提升运行效率、进而提升用户体验。

当然,没有在系统方面明确宣称人工智能进展的小米,也在利用AI提升用户体验,例如在个性拍照和相册归类等方面的应用,背后是机器视觉方面的能力。而且值得关注的是,小米已经在电视等产品中实现了语音助手、兴趣引擎等方面的落地,相信手机场景下的应用,也只是时间问题而已。

最后,让我们再回到锤子科技的坚果Pro发布会。虽然长达3小时的演讲展示中,罗永浩只字未提“人工智能”,但通不难看出锤子科技想要改变的现状——智能手机产品创新遭遇瓶颈的现状,需要新技术新交互提升易用性的现状。

罗永浩说,锤子只有现在做好准备,才能在下一代人机交互革命中成为上桌选手,才能由此实现“大到吓人”的野心。

想这么干的不止罗永浩。

下一代人机交互革命正在加速到来,正在AI浪潮中日渐清晰。


关于我们| 联系我们| 投稿合作| 法律声明| 返回顶部

版权所有 ©2015-2017 我在网 京ICP备14056282号-1

(function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();