www.hj8828.com 9

www.hj8828.com京东人工智能平台初次见面 便惊艳四座

很多人认为京东只是一家零售公司,其实如今的京东,已经开始全面转型成为技术驱动型公司。

7月26日-27日,2015中国人工智能大会(CCAI
2015)在北京召开,深度学习毫无意外地成为与会嘉宾热议的一个话题。来自京东DNN实验室的四位专家,核心科学家李成华、张晓鑫,以及京东智能通讯部总监刘丹、京东数据与机器智能部负责人杨洋参加了此次讨论,并接受了CSDN记者的采访,介绍了京东对人工智能和深度学习的认识,深度学习技术在京东的最新应用进展,以及京东DNN实验室的未来规划。

本周的输出分为:人工智能应用场景清单、人工智能投资清单、人工智能开放平台(中国部分)清单


京东曾在多个场合上强调,未来京东将通过AR/VR技术、深度学习、人工智能、机器人自动化等创新科技,真正实现物流智能化、无人化,将行业和社会的运营成本降低至极限,将用户体验提升至极限,最终发展成为全球领先的、真正实现智能化的商业体。

www.hj8828.com 1

人工智能应用场景清单:

人工智能的开发和算法改进的机会已经微乎其微,但是,利用人工智能应用层面的机会才刚刚开始。:

1、应用:视频监控

领域:安防领域

安防领域三大特点,1、政府采购,甲方购买力强。2、视屏监控数据海量。3、靠人工看视频,大量简单重复工作。

2、应用:身份认证

领域:安防领域

初创业公司Callsign,发明了一款名为“Callsign”的APP.

内置基于深度学习技术的多层身份认证和反欺诈行为分析AI模型,

用户:根据企业或个人所处的不同环境,在指纹、人脸、声波识别等方案中选择安全性最高的一个或者多个方案进行验证,从而同时兼顾安全与便捷性。

3、应用:网络选购服饰

领域:电商

美国初创公司3DLook推出了一款名为SAIA的APP

用户:可以通过一张正身照和侧身照构建的3D模型数据(内置机器学习算法)获得选购服饰时所需的参照尺码推荐

卖家:提供接口,能够根据获取到的尺码数据来合理备货。

该APP的尺码测量数据可以达到98%的准确率。

4、应用:智能停车和找车

领域:生活智能

用户:可以实现快速提车及找车

产品:阿里的喵街APP。智能停车和找车是其中的重要模块之一,目前应用9个成熟40多家购物中心。

5、应用:智能搜索和管理联动

领域:实体 零售

实体店商家:基于大数据智能分析、数据可视化、数据仓库等几个核心技术模块,通过行业订制化服务开发平台,可以为零售企业提供更为细致的智能服务及管理。

6、应用:智能穿衣镜

领域:生活智能

用户:通过内置处理器和摄像头,能够动态识别手势动作,面部特征及信息。获得个性化的订制服务,增加实际购物体验。

智能虚拟穿衣镜已经在顶级奢侈品牌百货商店NeimanMarcus 的加州Walnut Creek
店部署。

7、应用:智能比价、全网比价

领域:零售行业

沃尔玛APP加载了比价工具Savings
Catcher,截止2015年6月,沃尔玛的企业APP的用户已经达到2200万。

顾客:在实体店购物场景中,用手机扫描产品进行比价,发现更低价,价差返还。

8、应用:智能投顾订制理财

领域:金融

用户:借助大数据识别用户的风险偏好,在通过算法和模型定制风险资产组合。

目前国内智能投顾公司超过20家,按研发主体来分,中国智能投顾产品分为三类。传统金融公司:平安一账通、嘉实基金等。独立第三方智能投顾平台,弥财、蓝海财富、积木盒子等。互联网公司:京东智投、雪球财经、同花顺等

9、应用:语音交互

领域:智能家居

用户:解放双手,语音交互

智能家居的重点之一是人机交互,语音交互是首选。

亚马逊的智能音箱Echo、谷歌的GoogleHome、京东联合科大讯飞的叮咚音箱。

10、应用:医疗影像辅助诊断

领域:医药领域

患者:可以更快完成健康检查,同时获得更精准的诊断建议和个性化的治疗方案;

医生:可以节约读片时间、降低误诊率并获得提示(副作用等)。起到辅助诊断作用。

医院:在云平台的支持下可建立多元数据库,进一步降低成本,深度学习。

11、应用:手术机器人

领域:医疗机器人领域

患者:能够获得更精准的手术服务,降低风险。

最著名的是达芬奇机器人,由手术台以及可远程控制的终端两个部分组成。手术过程中,每个手臂各司其职且灵敏度远超人类,可以轻松进行微创手术等复杂困难的手术。

12、应用:智能外骨骼

领域:智能医疗

患者:只要上肢功能基本完整,他能帮助你完成基本的行走、爬楼梯以及一些特殊的训练动作。还有其他功能,例如:测量脉搏、电刺激、设定既定行走模式等。

俄罗斯的ExoAtletl 公司生产的两款“智能外骨骼”产品:ExoAtletl 和
ExoAtlePro

13、应用:分拣机器人

领域:仓储管理

商家:1、可以24小时不间断分拣。2、占地面积小,分拣效率高、可减少70%人工。3、精准、高效、提升工作效率、降低物流成本。

14、应用:药物数据查询

领域: 智能医疗

患者:比如,医药魔方,就是提供医药领域内药品和药企的重要数据和讯息,供行内个人和企业查询使用。

15、应用:购买私人订制保险

领域:保险行业

用户:用智能语音咨询保险业务

通过多运动、注意饮食提升自身健康、保持良好的开车习惯。降低购买保险费用。

保险公司:1、用智能语音回答客户问题,降低人工成本;2、在投保人手机上装活动检测设备,鼓励运动,注意饮食、休息。为健康用户提供保险打折服务。提升对用户的吸引力。

16、应用:利用人工智能分拣黄瓜

领域:农业

利用成熟的TensorFlow系统开发一个基于视觉识别的人工智能系统,给不同的黄瓜拍照,让人工智能学习长成什么样的黄瓜应该分拣到哪一级,然后在流水线上自动分拣,大大提升了分拣效率。

17、应用:法律文档整理、公司和个人保税系统准备

领域:生活、财务

这些都已经被开发出来,而且证明是相当优秀。关键要看如何应用。

18、应用:提升团队协作效率

领域:团队协作

NBA勇士队已经开始利用人工智能系统改善提升
球队的整体水平(而非强调个人能力),公司团队协作是否可以利用这着套系统来提升效率。

19、应用:控制无人机

领域:无人机领域

语音控制执行起飞、悬停、跟随、拍照、降落、移动等任务。利用机器视觉实现自动聚焦、通过对现有图库标准学习后可以分清图片单一的主题和背景的对比度。慢慢提升学习多主体和多背景的图片进行标准。

20、应用:建筑工程

领域:建筑工程领域

利用人工智能建立三维模型,自动分解,计算一座大楼所需要的成本,帮助人们进行资源采购和合理分配,把建造成本降到最低。


移动互联网时代,用户购物行为发生了改变,移动端、PC端等都可以成为购物的一个渠道,购物行为移动化,购物时间也越来越碎片化,用户需求在不断变化,如何满足用户?现有的零售行业也受到了巨大的冲击,商家如何快速洞察用户习惯及属性变化、更改产品销售模式、提升综合竞争力迫在眉睫。

京东眼中的人工智能

与业界同仁一样,京东在个性化推荐搜索、金融业务的授信风控中都采用了基于大数据的机器学习模型。不过在目前的阶段,京东DNN实验室目前的重点工作还是京东智能客服机器人JIMI的支持,也就是是NLP。李成华和张晓鑫分别负责底层核心技术用户意图识别、命名实体识别的研究,刘丹和杨洋侧重于产品化。刘丹提出了京东看待当前人工智能的三个基本观点:

  1. 人工智能系统水平的评测,除了图灵测试,可以通过在线用户满意度评价来分析系统是否足够智能。
  2. 受限于目前的硬件和软件环境,人工智能总体水平可能还不如三岁小孩,但特定环境下的上下文处理可以做得不错,所以人工智能应该是特定场景下的封闭式系统。
  3. 深度学习对人工智能的意义很大。基于DNN技术的知识图谱,做深层次的推理,比简单的人工打标签的方式要好很多,因为深度学习可以更容易地找到非常有用的特征。如京东用DNN做用户画像,实现的是2.3倍于人工的效果。

杨洋补充说,人工智能是用好数据的“大脑”。他表示,NLP/机器人是京东应用人工智能技术的切入点,但不是全部。归根结底,京东是要走的数据驱动的路线,无论以前研究传统的数据挖掘方法,还是去年成立DNN实验室,目的都是为了用好大数据。在他看来,大数据是京东的核心竞争力。而把人工智能放在大脑的地位,是走在正确的路上。

人工智能投资清单:

**投资方向:
**

人工智能产业链分为基础层、技术层和应用层,相关公司的布局主要有三种模式:基础层硬件设施提供者、平台生态构建者、垂直应用场景先行者


A股

机器人:

外骨骼康复机器人:科远股份

情感陪护机器人:东方网力、奥飞娱乐、江南化工

工业机器人:埃斯顿、快克股份、拓斯达

智能驾驶:合众思壮、巨星科技、汉邦高科、四维图新、千方科技、东软集团、荣之联、索菱股份、双林股份、天泽信息

工业4.0:京山轻机、软控股份、科远股份、宝信软件

视觉感知:

图像(人脸)识别与分析:佳都科技、川大智胜、汉王科技、远方光电、神思电子、御银科技

视频(安防)识别与分析:海康威视、大华股份、东方网力、数字政通

大数据特性:

智能金融:同花顺、恒生电子、东方财富、大智慧、丰东股份、奥马电器

智能医疗:思科医惠、万东医疗、万达信息、卫宁健康、华润万东、荣科科技

语音:

智能语音:科大讯飞

美股

基础设施:

GPU:英伟达

数据、算法:苹果、谷歌、亚马逊、Facebook、阿里巴巴


人工智能和大数据的走红,带了解决办法。以京东的业务作为基础,完整的覆盖了从采购、售卖到配送、客服等全电商流程,拥有中国电商领域最完整、最精准、价值链最长的数据。更为人工智能的充分实践,提供了丰富的数据基础,这也是京东发展人工智能技术和应用的资源优势。

深度学习在京东应用的最新进展

杨洋详细介绍了JIMI机器人的具体应用,包括京东主站的智能客服,负责网页单售前咨询、售后服务、闲聊、百科、专属服务,以及移动端基于HTML5的智能机器人和商家智能助手,负责半自动和全自动接待,商家管理后台等。JIMI机器人覆盖了京东首页、售前与售后客户,和社交平台等。

JIMI机器人的核心技术体系分为三个部分:

  • NLP体系。包括意图识别(特征抽取,多维分类模型,中文语法分析),命名实体识别(信息抽取泛化,结构化资源库),以及应答引擎(交互式场景,记忆能力,一问多答)。
  • 机器学习。包括有监督、半监督和无监督学习(数据资源智能构造,模型调优平台),基于用户反馈的学习(基于互动和反馈的学习,负责成百上千各模型的效果自动提升),半自动和全自动的评测体系(确认模型优化效果确实提高才允许上线),以及异构信息融合与挖掘(基于海量多类型数据挖掘并构造结构化知识库)。
  • 基于用户画像的咨询服务。包括个性化特征(基于购物行为、浏览行为等大数据识别个人特征),情绪识别(识别用户情绪及服务过程质量,服务上采取动态应对机制及人工介入),和意图预测(预测用户问题,半段是否适合机器人接待,实现人工服务和机器服务的智能分流)。

针对三轮以上的多轮对话的实现,杨洋解释说,最开始是尝试规则加场景加语音识别的机制,把单句作为一个对象处理,应答引擎有预设脚本,每个环节都对应了一个模型,每个模型会判断某句话是否和某个场景相关。最新的方法有一种补充机制,如果有感叹词,首先判断感叹词是否有意义,结合前面其他的特征一起来进行意图分类,从而实现多轮的效果。

有监督、半监督和无监督学习的区隔如下:

  • 有监督学习用于一些标准平台,包括每个模型解决什么样的业务数据,以及对京东非结构化数据整理;
  • 半监督学习主要采取半自动机器学习方法,比如训练出一系列模型,在训练模型里面实现预先分析,减少人工参与;
  • 无监督学习是对于京东大量商品的学习,以及与京东相关的一些爬虫、重复资源信息,以完善信息资源平台。

从技术层面上来说,刘丹认为,京东和同行各有千秋,但京东胜在数据质量,包括数据类型、数据的准备性,这是对学习效果是很关键的要素。京东自营的东西,质量可控程度最好。所以,JIMI在京东自营业务与非自营业务部分的满意度也不同:根据JIMI服务评价的统计,自营的满意度90%以上,非自营的只有80%
(当然也有京东自营的主要是标准化的产品的因素)。但刘丹强调,JIMI人工智能满意度达到80%,就达到了一个瓶颈。

张晓鑫解释说,机器学习就是从数据中抽取有效的特征,把这些特征作为输入函数建立模型,如果数据噪音非常大,优化的效果都不会特别好,但如果信息量足够大,同样也定义了最后能解决问题的上限。换言之,数据集的作用比特征的作用要大,特征的作用比模型的作用要大,但是每一个都是整个系统的,都会有一个瓶颈作用。这也是为什么包括图像分类在内,用同一种方法优化,错误率不会有很大的变化。

人工智能开放平台(中国部分)清单:

百度:

百度大脑介绍:

百度大脑是基于人工智能、机器学习等技术,建成超大规模的神经网络,拥有万亿级的参数、千亿样本、千亿特征训练,能模拟人脑的工作机制。

百度大脑开放平台官网:

百度大脑主要有四大能力:语音、图像、自然语言处理和用户画像等。

1.语音技术:语音识别、语音合成。

2.图像技术:基于深度学习算法,智能识别图像中文字内容和含义、通过人脸图像比对验证相似度以及检测图片色情度。

3.自然语言:基于自然语言处理技术,对人类自然语言进行分析、理解、生成、翻译,实现自然的人机对话交互。

4.用户画像:基于海量互联网数据,利用大数据分析处理能力,理解用户特征、兴趣偏好,实现精准的用户分析和个性化推荐。

应用场景

智慧物流、语音操控的智能音箱、用户个性化营销方案、真人验证及实名认证等。

图片示例:

www.hj8828.com 2

百度分布式深度学习平台Paddle:

百度深度学习是一款面向海量数据的深度学习平台。平台基于PaddlePaddle/TensorFlow开源计算框架,支持GPU运算,依托百度云分布式技术,为深度学习技术的研发和应用提供可靠性高、扩展灵活的云端托管服务。

优势:

入门简单:仅需选择框架类型和计算资源规模,即可开始深度学习模型训练。

开源开放:拥抱PaddlePaddle/TensorFlow开源社区,教程详细、资源丰富、应用广泛。

使用灵活:资源云端托管,按分钟计费,按需使用,用完即可释放。

支持GPU计算:可以选择使用GPU进行模型训练,提高模型训练的效率。

链接:

www.hj8828.com 3

阿里:

阿里云开放平台:推出了人工智能服务,包括机器学习PAI、语音识别与合成、人机对话、人脸识别、人脸识别、印刷文字识别等

www.hj8828.com,机器学习PAI:

阿里云机器学习是基于阿里云分布式计算引擎的一款机器学习算法平台,以极低的代价帮助您的业务从BI时代跨入AI时代,真正实现人工智能触手可及。

智能语音交互

智能语音交互(Intelligent Speech
Interaction),是基于语音识别、语音合成、自然语言理解等技术,为企业在多种实际应用场景下,赋予产品“能听、会说、懂你”式的智能人机交互体验。适用于多个应用场景中,包括智能问答、智能质检、法庭庭审实时记录、实时演讲字幕、访谈录音转写等场景,在金融、保险、司法、电商等多个领域均有应用案例。

……

图片示例:

www.hj8828.com 4

腾讯:

Tencent AI  Lab

机器视觉:

主要研究分支:图像视频的分析、理解与编辑,人脸的检测与识别,物体的检测、跟踪与分类,3D视觉,基于视觉的增强学习等。

语音识别:

主要研究分支:语言前端处理、声学模型/语言模型的建立、语言解码和语音合成等。

自然语言处理:

主要研究分支:语义分析、知识推理、智能问答、机器翻译等。

机器学习:

主要研究分支:机器学习理论,优化算法,大规模分布式计算,异构平台,以及创新监督,半监督,和增强机器学习算法的研究。

图片示例:

www.hj8828.com 5

www.hj8828.com 6

科大讯飞:

科大讯飞开放平台:

提供服务:游戏语音、人脸识别、声纹识别、AI电话客服等

图片示例:

www.hj8828.com 7

www.hj8828.com 8

图片示例:哨音2.0(运用科技践行)邀请你一起来学习人工智能开放平台的应用和交流。找到最适合自己的人工智能解决方案。

例子:你的公司市场推广是做电话营销,就可以使用科大讯飞的电话营销解决方案。在科大讯飞开源平台就可以解决。

www.hj8828.com 9

在海量的数据支撑下,通过深度学习,可以快速的为用户进行画像,结合用户之前的消费习惯、个人喜好等属性,京东会通过短信、APP、微信等多渠道为用户推送经过量身定制的专属推荐信息,挖掘出的潜在用户可以收到自己的个性化促销和信息,缩短单品购物时间,让纠结购物变成过去时。

智能客服的进化方向

数据质量一定,特征挖掘到了极限,这意味着需要从模型变换的角度来实现更好的效果。张晓鑫表示,下一步会想一些更新的方法从数据里面找到更有效的特征或者更好的模型,目前正在研究的包括RNN、CNN的方法,尝试把这些常用于图像、语音的模型引入到NLP中来。李成华补充说,通过集成学习的模型,可能把效果提高到一个新的高度。

京东没有用智能客服100%替代人工客服的想法(链接:京东DNN
Lab首席科学家:用深度学习搞定80%的客服工作),原因之一在于情感。刘丹表示,机器回答标准的答案,不包含情感,而人对商品不满意需要一个倾诉,机器未来几十年很难把人的情感分析很到位很清楚,因为人的大脑很庞大,机器只能逼近,不能超越,未来也是如此。

不过,虽有情绪识别模块,京东却似乎无意在情感分析方面更进一步,将EQ赋给JIMI来提升服务,这与社交机器人采取的路线大为迥异。张晓鑫表示,目前业界用深度学习来做情感分析的效果比传统方法好很多,JIMI只是定位某句话附带的是正向还是负向的情绪,但客服场景需要得到的更多。

刘丹补充说,客服场景里面,人的处理是跳跃性变化的,即便把情感分析加到人工智能上面来,未来很长时间内也很难做到。所以,JIMI的功能,更倾向于为京东精准营销、推荐搜索、销量预测等服务,这将得益于越来越成熟的用户画像技术。(链接:京东DNN
Lab新品用户营销的两种技术方案)

而谈到知识图谱对NLP的影响和挑战,张晓鑫表示,通过互联网信息的挖掘、去噪、结构化和推理,构建节点关系,形成知识体系,并逐步地积累,这是可行的,但真正完全的智能,最终的数学描述将会是一个非常高维的函数,而且如果是任意范围的数据处理,简单的关系也需要耗费大量的工作,所以目前人类只能在一个低维中间里找到一个好的近似。

李成华补充说,知识需要把关联起来才会更准确,京东目前也想要构建词与词的关系,知识与知识的关联,把这些知识整合到系统和数据里面,使模型越来越智能。采用的方法,是word2vec+DNN,把比较独立的知识训练起来,成为一个词相关性的向量,然后再把这些词向量重新整合深度学习的模型。