在东西方神话中,上古「智人」通过各种方法制造「人类」这一物种并赋予其智能;而到了中世纪的欧洲,古典哲学家们尝试着用机械符号处理的观点解释人类大脑的活动;直到 20 世纪 40 年代,来自数学,心理学,工程学,经济学和哲学等领域的一批科学家们基于抽象数学推理的可编程数字计算机的发明使得智能大脑出现的可能性被广泛探讨。
1950 年,Marvin Minsky 和 Dean Edmonds 建造了世界上第一台神经网络计算 SNARC(Stochastic Neural Analog Reinforcement Calculator),它通过使用 3000 个真空管和 B-24 轰炸机上的自动指示装置模拟了 40 个神经元而组成神经网络。
同期,被誉为「计算机科学之父」的 Alan Turing 在 Mind 上发表论文,第一次提出机器智能设想。虽然未提到具体的研究方法,但论文中提到的「图灵测试」、「机器学习」、「遗传算法」和「强化学习」等理论也在日后成为了人工智能领域重要的分支。
图灵的计算理论认为任何形式的计算均可被数字信号描述,这也为人工智能的后续实践提供了理论基础。
随后的 1956 年,在 Marvin Minsky 连同 Claude Shannon 和 Nathan Rochester 一起组织的 Dartmouth 会议上,「人工智能」这个概念首次被提出并开启了西方「人工智能」科学长达半个多世纪的高速发展。
在中国,关于「人工智能」的研究和探讨在 70 年代末被解禁后又不适时地与「特异功能」联系在一起而停滞不前,直到 80 年代初期随着技术和思想的不断进步才取得实质性进步。
而今,全球共有近千家人工智能公司遍及 62 个国家的十余个产业,国内涉及人工智能领域的公司也早已破百。
除了「机器学习」、「模式识别」和「神经网络」这些晦涩的词汇和各种层出不穷的借势营销,这个看似离我们越来越近的市场却在「互联网玄学」的外衣下显得愈发迷雾重重。
那么,关于人工智能,你究竟了解多少?在下一个产业浪潮到来之前,我们到底又应该关注什么?
一、国内人工智能产业链解构
「基础技术」、「人工智能技术」和「人工智能应用」构成了人工智能产业链的三个核心环节,我们将主要从这三个方面对国内人工智能产业进行梳理,并对其中的「人工智能应用」进行重点解构。
1.基础技术提供平台
人工智能的基础技术主要依赖于大数据管理和云计算技术,经过近几年的发展,国内大数据管理和云计算技术已从一个崭新的领域逐步转变为大众化服务的基础平台。而依据服务性质的不同,这些平台主要集中于三个服务层面,即「基础设施即服务(IaaS)」、「 平台即服务(PaaS)」和「软件即服务(SaaS)」。
基础技术提供平台为人工智能技术的实现和人工智能应用的落地提供基础的后台保障,也是一切人工智能技术和应用实现的前提。
对于许多中小型企业来说,SaaS 是采用先进技术的最好途径,它消除了企业购买、构建和维护基础设施和应用程序的需要;而 IaaS 通过三种不同形态服务的提供(公有云、私有云和混合云)可以更快地开发应用程序和服务,缩短开发和测试周期;作为 SaaS 和 IaaS 中间服务的 PaaS 则为二者的实现提供了云环境中的应用基础设施服务。
SaaS:提供给客户的服务是运营商运行在云计算基础设施上的应用程序,用户可以在各种设备上通过客户端界面访问,如浏览器。
PaaS:将软件研发的平台作为一种服务,以 SaaS 的模式提交给用户。
IaaS:分为公有云、私有云和混合云三种形态,提供给消费者的服务是对所有设施的利用,包括处理器、存储、网络和其它基本的计算资源,用户能够部署和运行任意软件,包括操作系统和应用程序。
2.人工智能技术平台
与基础技术提供平台不同,人工智能技术平台主要专注于「机器学习」、「模式识别」和「人机交互」三项与人工智能应用密切相关的技术,所涉及的领域包括机器视觉、指纹识别、人脸识别、视网膜识别、虹膜识别、掌纹识别、专家系统、自动规划、智能搜索、定理证明、博弈、自动程序设计、智能控制、机器人学、语言和图像理解和遗传编程等。
机器学习:通俗的说就是让机器自己去学习,然后通过学习到的知识来指导进一步的判断。我们用大量的待遇标签的样本数据来让计算机进行运算并设计惩罚函数,通过不断的迭代,机器就学会了怎样进行分类,使得惩罚最小。这些学到的分类规则可以进行预测等活动,具体应用覆盖了从通用人工智能应用到专用人工智能应用的大多数领域,如:计算机视觉、自然语言处理、生物特征识别、证券市场分析和 DNA 测序等。
模式识别:模式识别就是通过计算机用数学技术方法来研究模式的自动处理和判读,它偏重于对信号、图像、语音、文字、指纹等非直观数据方面的处理,如语音识别,人脸识别等,通过提取出相关的特征来实现一定的目标。文字识别、语音识别、指纹识别和图像识别等都属于模式识别的场景应用。
人机交互:人机交互是一门研究系统与用户之间的交互关系的学问。系统可以是各种各样的机器,也可以是计算机化的系统和软件。在应用层面,它既包括人与系统的语音交互,也包含了人与机器人实体的物理交互。
而在国内,人工智能技术平台在应用层面主要聚焦于计算机视觉、语音识别和语言技术处理领域,其中的代表企业包括科大讯飞、格灵深瞳、捷通华声(灵云)、地平线、SenseTime、永洪科技、旷视科技、云知声等。
3.人工智能应用
人工智能应用涉及到专用应用和通用应用两个方面,这也是「机器学习」、「模式识别」和「人机交互」这三项人工智能技术的落地实现形式。
其中,专用领域的应用涵盖了目前国内人工智能应用的大多数应用,包括各领域的人脸和语音识别以及服务型机器人等方面;而通用型则侧重于金融、医疗、智能家居等领域的通用解决方案,目前国内人工智能应用正处于由专业应用向通用应用过度的发展阶段。
(1)计算机视觉
在国内计算机视觉领域,动静态图像识别和人脸识别是主要研究方向:
图像识别,是计算机对图像进行处理、分析和理解,以识别各种不同模式的目标和对像的技术。识别过程包括图像预处理、图像分割、特征提取和判断匹配。
人脸识别,是基于人的脸部特征信息进行身份识别的一种生物识别技术。用摄像机或摄像头采集含有人脸的图像或视频流,并自动在图像中检测和跟踪人脸,进而对检测到的人脸进行脸部的一系列相关技术,通常也叫做人像识别、面部识别。
目前,由于动态检测与识别的技术门槛限制,静态图像识别与人脸识别的研究暂时处于领先位置,其中既有腾讯、蚂蚁金服、百度和搜狗这样基于社交、社交、搜索大数据整合的互联网公司,也有三星中国技术研究院、微软亚洲研究院、Intel 中国研究院这类的传统硬件与技术服务商;同时,类似于 Face++ 和 FaceID 这类的新兴技术公司也在各自专业技术和识别准确率上取得了不错的突破。
而在难度最大的动态视觉检测领域,格灵深瞳、东方网力和 Video++ 等企业的着力点主要在企业和家庭安防,在一些常见的应用场景也与人脸识别技术联动使用。
图像识别代表企业:百度、搜狗、三星中国技术研究院、微软亚洲研究院、Intel 中国研究院等。
人脸识别代表企业:旷视科技、腾讯优图、蚂蚁金服、FaceID、汉王科技、三星中国技术研究院、微软亚洲研究院、中科奥森、深圳科葩、linkface、SenseTime 等。
动态视觉检测代表企业:格灵深瞳、东方网力、Video++ 等。
(2)语音/语义识别
语音识别的关键在于基于大量样本数据的识别处理,因此,国内大多数语音识别技术商都在平台化的方向上发力,希望通过不同平台以及软硬件方面的数据和技术积累不断提高识别准确率。
在通用识别率上,各企业的成绩基本维持在 95% 左右,真正的差异化在于对垂直领域的定制化开发。
类似百度、科大讯飞这样的上市公司凭借着深厚的技术、数据积累占据在市场前列的位置,并且通过软硬件服务的开发不断进化着自身的服务能力;此外,在科大讯飞之后发布国内第二家「语音识别公有云」的云知声在各项通用语音服务技术的提供上也占据着不小的市场空间。
另外,除了科大讯飞,依托中科院自动化所的紫冬锐意和纳象立方以及有着海外背景的苏州思必驰在教育领域的语音识别上占据着领先的位置。
值得注意的是,不少机器人和通用硬件制造商在语音、语义的识别上也取得了不错的进展,例如智臻智能推出的小 i 机器人的语义识别、图灵机器人的个性化语音助手机器人和服务、被 Google投资的出门问问的软硬件服务。
语音识别:科大讯飞、百度、出门问问、智齿客服、思必驰、云知声、助理来也、京东 JIMI 智能客服、普强科技、捷通华声、紫冬锐意、纳象立方等。
语义识别:科大讯飞、百度、腾讯、智臻智能、智齿客服、助理来也、京东 JIMI 智能客服等。
(3)智能机器人
由于工业发展和智能化生活的需要,目前国内智能机器人行业的研发主要集中于家庭机器人、工业\企业服务和智能助手三个方面。
根据《中国服务机器人市场现状调研与发展前景分析报告(2015-2020年)》中的数据,2014 年,我国服务机器人销售额 45.56 亿元,同比增长 34%;分布地区主要集中在经济较为发达的环渤海(27.3%)及长三角(29.6%)、珠三角地区(32.7%),中部地区(8.9%)和西部地区(1.5%)应用较少。
其中,工业及企业服务类的机器人研发企业依托政策背景和市场需要处于较为发达的发展阶段,代表性企业包括依托中科院沈阳自动化研究所的新松机器人、聚焦智能医疗领域的博实股份,以及大疆、优爱宝机器人、Slamtec 这类专注工业生产和企业服务的智能机器人公司。
在以上三个分类中,从事家庭机器人和智能助手的企业占据着绝大多数比例,涉及到的国内企业近 300 家,其中的代表性企业包括:
家庭机器人:优必选、Rokid、公子小白机器人、北冥星眸GalaxyEye、A.I.Nemo、极思维智能科技等。
智能助手:百度、小 i 机器人、图灵机器人、优必选、北冥星眸GalaxyEye、萝卜科技等。
工业\企业服务:新松机器人、博实股份、优爱宝机器人和 Slamtec 等。
(4)智能家居
与家庭机器人不同,智能家居和物联企业的主要着力点在于智能设备和智能中控两个方面。
在这其中,以海尔和美的为代表的传统家电企业依托自身渠道、技术和配套产品优势建立起了实体化智能家居产品生态。
而以阿里、腾讯、京东、小米和乐视等互联网企业为代表的公司则通过各自平台内的数据和终端资源提供不同的软硬件服务。
值得关注的是,科沃斯、broadlink、感居物联、风向标科技、欧瑞博、物联传感和华为等技术解决方案商在通用硬件和技术、系统级解决方案上已成为诸多智能家居和物联企业的合作伙伴。
综合来看,智能家居和物联企业由于市场分类、技术种类和数据积累的不同各自提供着差异化的解决方案。在既定市场中,没有绝对意义上的排斥竞争,各企业之间的合作融合度较强。
传统家电企业:海尔U+、美的M-Smart 等。
互联网企业:阿里小智、QQ 物联、京东微联、小米、乐视乐居家等。
技术解决方案商:科沃斯、broadlink、感居物联、风向标科技、欧瑞博、物联传感、华为等。
(5)智能医疗
目前国内智能医疗领域的研究主要集中于医疗机器人、医疗解决方案和生命科学领域。
由于起步较晚和技术门槛的限制,目前国内医用机器人的研发水平和普及率相较于国际一线水平仍存在一定的差距,从事企业主要集中与手术机器人和康复机器人两大领域,以新松机器人、博实股份、妙手机器人、璟和技创等企业为代表。
在医疗解决方案方面,以腾讯、阿里巴巴、百度和科大讯飞为代表的公司通过和政府、医疗机构的合作,为脑科学、疾病防治与医疗信息数据等领域提供智能解决方案。
而在生命科学领域,研究的着眼点在以基因和细胞检测为代表的前沿研究领域,代表企业有华大基因、碳云智能和贝瑞和康等。
医疗机器人代表企业:新松机器人、博实股份、妙手机器人、璟和技创等。
医疗解决方案代表企业:腾讯、阿里巴巴、百度、科大讯飞等。
生命科学代表企业:华大基因、碳云智能、贝瑞和康、安诺优达、联合基因、北科生物等。
综合来看,国内人工智能产业链的基础技术链条已经构建成熟,人工智能技术和应用则集中在人脸和图像识别、语音助手、智能生活等专用领域的场景化解决方案上。就趋势来看,未来国内人工智能领域的差异化竞争和突破将主要集中在人工智能相关技术的突破和应用场景升级两个层面。
二、国内人工智能行业关键力量
在国内人工智能产业链中,虽然 80% 的企业属于 B 轮或 B 轮以前的初创企业,但值得注意的是,仍有一批关键势力依托自身技术、资金与数据门槛构成了国内人工智能行业的第一梯队。这其中既包括以 BAT 为代表的传统巨头,也有科大讯飞这样的细分领域龙头。从日渐完善产品线到平台构建,这些企业形成了国内人工智能行业的核心力量与关键势力。
1.百度:技术驱动的应用型生态
百度在人工智能领域的布局更侧重于应用型生态,在 BAT 三家中,百度也是最接近由专用应用向通用应用过度的公司。
目前,百度研究院有三大实验室,分别是北美硅谷人工智能实验室、北京深度学习实验室和北京大数据实验室,目前已在图像识别、图像搜索、语音识别、自然语言处理、智能语义、机器翻译和精准广告等方面取得了显著进展(超过 500 项国际专利,其中包括超过 270 项的神经语言程序学领域专利和超过 120 项的深度学习专利)。
凭借搜索引擎发家的百度拥有强大的数据获取和挖掘的能力,百度为外界提供了大数据存储、分析和挖掘技术,促进其在医疗、交通等多领域的具体运用,并在若干领域开放了自己的人工智能生态并发布了多款应用型产品。
语音识别
在语音识别方面,吴恩达及研究团队发明了一种新的语音识别方法,这款基于深度学习的语音识别系统可以在嘈杂环境下实现将近 81% 的辨识准确率。该语音识别系统采用深度学习算法取代了原来的模型,在递归神经网络或者模拟神经元阵列中进行训练,让语音识别系统更加简单。
图像识别
在图像识别方面,百度也一直在利用深度学习技术来提高图像识别的精度。2014 年 9 月,百度云结合百度深度学习研究院提供的人脸识别及检索技术,推出云端图像识别功能。11 月,百度发布了基于模拟神经网络的「智能读图」,可以使用类似人脑思维的方式去识别、搜索图片中的物体和其他内容。
深度学习
为满足深度学习在计算和存储上的要求,百度在国内建立了十几座云计算中心并投入使用了4万兆交换机。此外,百度还是全球首家将 GPU 用于人工智能和深度学习领域、并规模化商用 ARM 服务器的公司。
整合了这些的百度形成强大的存储计算能力,从而可以进行多样的并行计算,支持生成、配置针对不同应用和场景网络结构,为人工智能提供有力的硬件支持。
其中最具代表性的「百度大脑」通过深度学习来模拟人类大脑的神经元,参数规模达到百亿级别,构建了世界上最大规模的深度神经网络。百度大脑融合了深度学习算法、数据建模、大规模 GPU 并行化平台等技术,实现了实时学习和成长,它拥有 200 亿个参数,构成了一套巨大的深度神经网络。
2.腾讯:基于用户体系的软硬件服务型生态
相比于以技术为导向的百度人工智能生态,依托高频应用和庞大用户群体的腾讯在人工智能领域的布局主要聚焦于基于用户体系的软硬件服务型生态。
随着技术成熟和应用环境的成熟(移动端设备普及、用户使用习惯和认可度的提升、云服务软件形态的成熟),整个人脸识别和图像识别行业都属于朝阳产业,而有着中国互联网最大用户基础的腾讯也选择了在人脸和图片识别领域的切入,这也成为了整个腾讯人工智能生态的最和谐竞争力。
在这一领域的技术研发和落地应用中,腾讯均处于国际领先地位。在 FDDB 人脸检测、LFW 人脸识别、PASVAL VOC2012 图片识别大赛中,腾讯优图团队都刷新了国际识别准确率记录。
依托腾讯内部完善的生态,腾讯优图的人脸识别技术已组建与金融、安防与身份识别等领域结合在一起。其中,既包括与腾讯征信、微众银行和财付通、QQ、广点通等内部业务的合作,也涉及与相关机构的信用评估和基于公安部数据的全国公民身份证号码查询服务。在内外部的合作中,相关技术也在业务中完整落地形成闭环,经过业务海量数据的长期实际考验,并持续反馈来优化算法。
而在成立了腾讯智能计算与搜索实验室之后,微信也与香港科技大学联合建立了人工智能实验室,主要研究方向包含语音识别、图像识别、语义理解等方面,部分基础研究成果(如语音转文字)已被集成为微信功能。
值得注意的是,在专业应用领域,腾讯也在不同程度上做出了尝试。无论是由腾讯财经研发的自动写作机器人「Dreamwriter」还是在硬件领域推出的智能球型机器人「微宝」都反映了腾讯在未来更多细分领域推出服务型产品的思路。
未来,随着 TencentOS 的应用以及 QQ、微信物联更多的落地实践,腾讯在智能生活层面硬件产品的研发也是非常值得关注的领域。
3.阿里巴巴:以阿里云为基础的业务蓝图
与腾讯和百度不同的是,阿里巴巴在人工智能领域的布局主要集中在专业领域的通用应用和智能家居两个方面,而这一切都离不开以阿里云为基础的大规模分布式云计算和 GPU 集群。
从 2015 年开始,阿里就开始在人工智能领域发力,其中最具代表性的是首个可视化人工智能平台 DTPAI,它集成了阿里巴巴核心算法库,包括特征工程、大规模机器学习、深度学习等。在此基础上,阿里巴巴推出人工智能客服「小蜜」以及基于神经网络、社会计算、情绪感知等原理工作的智能程序小「Ai」。
2015 年 6 月,阿里巴巴向软银旗下的机器人公司 SBRH 战略注资 145 亿日元。相比于机器人制造,阿里巴巴的优势在云计算和大数据领域,这也将成为阿里巴巴在机器制造领域的差异化竞争壁垒。
而通过投资 SBRH,阿里巴巴得以建立起机器人产业的通路,并在机器视觉、语音解析、家庭智能控制、智能网络安全等方面与 SBRH 建立研究合作和沟通机制,帮助其在智能家居方面基础技术的积累和扩展。
在智能物联领域,阿里巴巴整合了集团旗下天猫电器城、阿里智能云、淘宝众筹三个业务部门,在内部调动各类优质资支持智能产品的推进并加速智能硬件孵化速度。而在 2015 年 4 月,阿里巴巴集团宣布成立阿里巴巴智能生活事业部,全面进军智能生活领域。
4.科大讯飞:基于语音系统的通用解决方案
与 BAT 三家围绕自身技术、用户与基础服务构建着差异化的人工智能竞争生态不同,科大讯飞选择在语音识别这一单点领域进行突破,并围绕于此建立基于语音系统的通用解决方案平台。
依托于中文语音合成、语音识别、口语评测等多项技术研发与突破,科大讯飞以专用领域的技术解决方案为切口,分别在智能家居、行业安全、教育考试解决方案、智能硬件语音识别解决方案等专用领域产品的研发构建了目前国内最全的语音技术平台并实现了语音领域最为广泛的落地解决方案。
基于此,科大讯飞也最接近由人工智能专用技术解决方案商向通用技术应用平台的角色过渡。就目前科大讯飞推出的从大型电信级应用到小型嵌入式应用,从电信、金融等行业到企业和家庭用户以及从 PC 到手机等各种移动设备来看,科大讯飞已具备能够满足不同应用环境的多种产品的能力。
而在目前的国内语音识别市场上,科大讯飞研发的语音合成产品的市场份额达到 70% 以上,在电信、金融、电力、社保等主流行业的份额更达 80% 以上,开发伙伴超过 10000 家,以讯飞为核心的中文语音产业链已初具规模。
可以看出, 百度、腾讯和阿里巴巴三家巨头分别围绕着自身技术、用户与基础服务构建着差异化的人工智能竞争生态。其中,百度和腾讯更侧重于图像、语音和智能生活场景的解决方案,而阿里巴巴虽然对此有所涉猎,但主要重心在于数据和技术结合的服务型人工智能解决方案提供上。
与 BAT 为代表的大而全生态构筑不同,科大讯飞依托绝对市场份额的绝对占有率和构筑多年的技术门槛形成了他们在语音识别解决方案领域独特的市场竞争力,这也为国内其他初创型人工智能企业的未来发展提供了良好的借鉴。
可以预见的是,人工智能产品线更为完整的百度将会更快地由专用领域人工智能向通用领域人工智能过度,腾讯的视觉和生活场景解决方案也将有更多的落地实践空间,阿里巴巴则会在基础技术提供和综合解决方案上形成自己的竞争壁垒;而以科大讯飞为代表的由专用领域技术解决方案商向专业平台过渡的模式也将会成为相当一部分初创型人工智能企业发展的借鉴。
三、八个国内人工智能领域最具价值的新锐公司
除了以 BAT 和科大讯飞为代表的核心势力,近几年来国内也涌现出了一大批极具发展前景和投资价值的初创型人工智能企业。他们分别在计算机视觉、语音识别、智能生活解决方案和医疗基因等领域形成自己差异化的竞争态势,并在各自领域内的技术领先度和市场占有率上领先其他对手。
在这其中,既有格灵深瞳和旷视科技类的现实应用服务解决商,也涉及到华大基因和碳云智能这类的未来技术研发商,他们一道组成了国内人工智能领域未来发展的不可忽视力量。
1.格灵深瞳
在国内初创型人工智能企业中,格灵深瞳可以算是国内计算机视觉商业解决方案,尤其是在动态图像识别领域最具代表性的企业,这一切也得益于格灵深瞳在人和车的检测、跟踪与识别方面所形成的技术门槛。
在具体应用中,除了在人脸识别、图片识别、视频内容识别、OCR、三维深度视觉等方面中的数款落地产品的推出,格灵深瞳还早早地将落地应用瞄准了零售、安防、汽车等领域。在行业自动化与智能化的技术实践中,格灵深瞳走在了国内计算机视觉识别领域的前列。
除此之外,格灵深瞳还在早期通过开放计算机视觉模块的方式尝试进行计算机视觉技术平台的搭建,这一类似科大讯飞发展路径的战略规划也将使得更多计算机视觉领域的优秀企业提供更多的智能化解决方案并推动格灵深瞳内部产品的优化与创新。
2.旷视科技
与格灵深瞳稍显不同的是,旷视科技的优势集中在人脸识别和静态图片识别解决方案的落地实践上。通过人脸识别云服务平台 Face++、Image++ 以及智能硬件 Megvii C1 等产品的推出,旷视科技在人脸识别和静态图片识别等领域为行业解决方案、智慧安防解决方案获得了最为广泛的应用成果。
在国内以人脸识别为核心的计算机识别技术代表公司中,旷视科技不仅在识别准确率上取得了领先,在金融、安防等领域的落地应用中,旷视科技也提供了最成熟的技术解决方案。
在这其中,作为阿里巴巴的战略合作伙伴,旷视为支付宝开发人脸识别模块,其识别率超过了 99%;除此之外,旷视科技还为小米金融、联想之星、民生银行和公安系统等企业、单位和机构提供不同的视觉技术解决方案。
3.优必选
在国内智能机器人研发与应用企业层出不穷的同时,「优必选」选择了以服务型机器人市场为切口构筑竞争壁垒。
基于这一思路,「优必选」从人形机器人的核心源动力伺服舵机研发起步,逐步推出了消费级人形机器人、商业人形机器人、智能家居机器人和积木机器人系列。
在国内商用化人形机器人普遍面临零件成本过高和编程困难的瓶颈情况下,「优必选」的优势在与选择了一条从机器人的研发、零配件制造、生产、到销售全部环节的商业化道路。
从机器人在结构上、硬件上的核心的关键部位到人形机器人研发生产,继而进军机器人 app 软件商店,甚至牵动全球机器人爱好者一同参与到编程开发的环节上来,「优必选」形成一个开放式的产业生态系统,让服务型人形智能机器人同时成为未来多个智能领域的入口。
4.出门问问
一套成熟的语音识别和语义理解系统 Ticwear 以及搭载该系统的智能硬件 Ticwatch,「出门问问」是国内智能语音领域软硬件联动和应用结合最成熟的企业。
在具体的应用中,「出门问问」完全接受语音输入,通过语音识别将用户声音转化为文字,再运用自然语意分析理解用户行为,给用户以精准的搜索结果,其核心技术在于用自然语义分析来理解人们像日常说话一样的提问。
目前,已获得 Google C 轮融资的「出门问问」总估值达 3 亿美金,其产品方向也由智能语音解决方案进一步扩展到了智能生活助手领域。
5.地平线机器人
与大多数商用机器人解决方案商专注于机器人系统的软硬件研发不同的是,由百度深度学习研究院( IDL )创始人余凯创办的「地平线机器人」则聚焦于基于深度神经网络的人工智能「大脑」平台 。
「地平线机器人」所搭建的人工智能「大脑」平台包括软件和芯片和人工智能的解决方案,目前已经研发出分别面向自动驾驶的「雨果」平台和智能家居的「安徒生」平台,并取得了多项落地成果。
在具体的应用中,「地平线机器人」将云端的大规模深度神经网络算法实现在高性能低功耗的「大脑引擎」上,大幅提高了设备端上的智能;依托于横跨图像、语音、自然语言理解和运动控制上的软硬件解决方案,「地平线机器人」的应用领域涵盖智能家居、汽车和安全等
6.Broadlink
在国内智能家居市场,「Broadlink」是鲜有在软硬件解决方案上均取得领先的新兴企业。
在具体应用中,「Broadlink」自主研发的 Wi-Fi 物联网传输模块、云计算平台和智能终端 app 应用,为各类家电厂商提供了成熟完整的智能家电解决方案;同时「Broadlink」还为用户提供 DIY 智能插座、智能遥控、家庭空气质量分析仪等智能家居产品。
早期,BroadLink 是智能家居解决方案的提供商,包括 WIFI、GPRS 联网方案以及整套监控系统。BroadLink 最早开始涉足的领域是太阳能,目前众多太阳能企业成为忠实客户。
后来,BroadLink 在点名时间的众筹,将产品推到用户面前,获得了普通用户的认知和支持,接着发布自己的多款产品,包括智能插座 SP2、智能遥控 RM2、墙壁触控开关 TC1、空气质量检测仪 e-Air,基于 BroadLink DNA 做产品上的尝试,之后,顺势推出 BroadLink DNA 这样家用电器实现智能化的解决方案。
从 BroadLink 的发展历史可以看出,原本就是智能家居解决方案的提供商在经历了产品这个维度之后,又回到当初做智能家居解决方案提供商的起点。但在这个过程里,基于 BroadLink 系列产品的成功和尝试,原本智能家居解决方案的基因和 DNA 已经发生了进化,将互联网的互通互联引入,成为一套更为智能更加开放的多元化方案。
7.华大基因
在国内乃至全球人工智能领域最前沿也是最难突破的生命科学领域,「华大基因」选择了「基因」作为研究的突破口。
通过简历高端仪器研发和制造平台、大规模测序、生物信息、基因检测、农业基因组、蛋白组等技术平台和大数据中心,「华大基因」实现了从中心法则到结构与功能的贯穿研究,并以此构建了生物技术与信息技术相融合的网络体系。
此外,通过「国家基因库」的构建,「华大基因」还在多个层面与国家医疗、技术、教育等机构进行了深度研究合作,这也是其他同类企业所不具备的竞争优势和壁垒。
8.碳云智能
由原「华大基因」CEO 王俊创办的「碳云智能」在人工智能健康领域选择了同「华大基因」不同的方向——健康大数据平台,通过运用人工智能技术处理这些数据,帮助人们做健康管理。
「碳云智能」的数据来源包括两部分,一部分靠自己的技术能力获取,一部分靠合作伙伴获取。靠该团队的核心技术获取的有基因数据、微生物数据(肠道、口腔、皮肤等)、蛋白及代谢数据(尿液、汗液、血液等)等,合作伙伴包括研究机构、药厂、体检中心、医院、诊断公司、保险公司、健康管理公司等,从合作伙伴处获取的数据有临床及体检数据、环境数据、运动数据、饮食数据等等。
目前,「碳云智能」已经建立了数据采集和技术平台、人工智能数据分析技术平台、智能硬件、数据库和样本库及为每个用户提供个性化 O2O 体系的五大基础设施;而在企业服务上,「碳云智能」也通过为药厂、化妆品公司、农业企业、体检中心等提供相关的数据服务建立着自己的服务入口。
四、未来国内人工智能行业发展的五大趋势
(1)机器学习与场景应用将迎来下一轮爆发
根据 Venture Scanner 的统计,截至 2015 年 9 月,全球人工智能领域获得投资的公司中,按照平均融资额度排名的五大业务依次是:机器学习(应用类)、智能机器人、计算机视觉(研发类)、机器学习(研发类)和视频内容识别等。
自 2009 年以来,人工智能已经吸引了超过 170 亿美元的投资。过去四年间,人工智能领域的民间投资以平均每年 62% 的增长速率增加,这一速率预计还会持续下去。
而在 2015 年,全球人工智能领域的投资占到了年度总投资的 5%,尽管高于 2013 年的 2% ,但相比其他竞争领域仍处于落后位置。
目前中国地区人工智能领域获得投资最多的五大细分领域是计算机视觉(研发类)、自然语言处理、私人虚拟助理、智能机器人和语音识别。从投资领域和趋势来看,未来国内人工智能行业的资本将主要涌向机器学习与场景应用两大方向。
数据储存容量和技术能力的提升为机器学习爆发提供了基础保障,而机器学习又是人工智能的核心技术和涵盖面最广的应用手段;但由于现阶段运算能力的局限和通用解决方案的研发门槛限制,基于安防、智能生活、教育和健康等场景的场景应用成为了大多数国内企业在人工智能领域的突破口。
真格基金:地平线机器人、智齿科技、格灵深瞳、助理来也、亿航无人机、泼辣熊、零零无限科技。
红杉资本中国:地平线机器人、格灵深瞳、助理来也、大疆科技等。
IDG资本:小i机器人、智齿科技、SenseTime、碳原子科技、芋头科技、零零无限科技、科沃斯机器人等。
创新工场:蓝胖子机器人、小鱼在家、易致机器人、旷世科技等。
金沙江创投:地平线机器人、零零无限科技、天机等。
北极光创投:图谱科技、进化动力等。
启明创投:云知声、旷世科技等。
东方富海:亿航无人机、永洪科技等。
联想之星:旷世科技、思必驰、乐驾等。
晨兴资本:地平线机器人、碳原子科技、美洽等。
英诺天使基金:臻迪智能、通用机器人、速感科技等。
GGV纪源资本:亿航无人机、深之蓝水下机器人、元趣味等。
湖杉资本:天博智、元趣等。
光速安振中国创业投资:助理来也、小鱼在家等。
高通:云知声、七鑫易维等。
线性资本:地平线机器人、芋头科技等。
经纬中国:Camera360、永洪科技等。
达泰资本:金石机器人、永洪科技。
极客帮创投:异构智能、碳原子科技等。
(2)专用领域的智能化仍是发展核心
基于 GPU(图形处理器)计算速度(每半年性能增加一倍)和基础技术平台的飞速发展,企业对于人工智能神经网络的构建取得了前所未有的突破。但是,由于人工智能各领域技术和算法的复杂性,未来 20 年内人工智能的应用仍将集中于人脸和图像识别、语音助手和智能家居等专用领域。
通过上述产业链环节构成和投资分类可以看出,优势企业的核心竞争力主要集中于特定领域的专用技术研发;其中,计算机视觉和语音识别领域的研发和应用已处于国际一流水平,专业应用机器人的研发也有望近 10 年内迎来突破性发展。
可以预见的是,在由专业领域向通用领域过渡的过程中,自然语言处理与计算机视觉两个方向将会成为人工智能通用应用最大的两个突破口。在未来 20 年内,通用领域研发所需的技术和数据也会随着各专用领域差异化发展的日臻成熟而迎来突破。
(3)产业分工日渐明晰,企业合作大于竞争
随着专用领域应用开发的成熟和差异化技术门槛的存在,国内人工智能产业将逐渐分化为底层基础构建、通用场景应用和专用应用研发三个方向。
在底层基础构建方面,腾讯、阿里巴巴、百度、华为等企业依托自身数据、算法、技术和服务器优势为行业链条的各公司提供基础资源支持的同时,也会将自身优势转化为通用和专业应用领域的研究,从而形成自身生态内的人工智能产业链闭环。
在通用场景应用方面,以科大讯飞、格灵深瞳和旷视科技为代表的企业将主要以计算机视觉和语音识别为方向,为安防、教育和金融等领域提供通用解决方案。
而在专用应用研发方面则集中了大部分硬件和创业企业,这其中既包括以小米和 broadlink 为代表的智能家居解决方案商,也包含了出门问问、linkface 和优必选这类的差异化应用提供商。
总的来说,由通用领域向专业领域的进化离不开产业链条各核心环节企业的相互配合,专用领域的竞争尽管存在,但各分工层级间的协作互通已成为多数企业的共识。
(4)系统级开源将成为常态
任何一个人工智能研究分支都涉及到异常庞大的代码计算,加上漏洞排查与跨领域交叉,任何一家企业都无法做到在封闭环境内取得阶段性突破的可能。
可以看到的趋势是,Google、微软、Facebook 和雅虎等视人工智能为未来核心竞争力的顶级企业都先后开放了自身的人工智能系统。
需要明确的一点是,开源并不代表核心技术和算法的完全出让,底层系统的开源将会让更多企业从不同维度参与到人工智能相关领域的研发,这为行业层面新产品的快速迭代和共同试错提供了一个良性且规范化的共生平台。于开放企业而言,这也确保了它们与行业最新前沿技术的同步。
基于此,腾讯、阿里巴巴、百度和科大讯飞等在人工智能领域取得领先优势的企业都在不同维度和空间开放了自身的人工智能系统。而在未来,随着专用领域应用的普及和通用技术应用需求的增强,这种开放性还会不断地加大。
(5)算法突破将拉开竞争差距
作为人工智能实现的核心,算法将成为未来国内人工智能行业最大的竞争门槛。以 Google 为例,Google 旗下的搜索算法实验室每天都要进行超过 200 次的改进,以完成由关键字匹配到知识图谱、语义搜索的算法创新。
在未来竞争的重点机器学习领域,监督学习、非监督学习和增强学习三个方面算法的竞争将进入白热化阶段。而正是算法层面的突破造就了腾讯优图、科大讯飞和格灵深瞳等企业在图像识别和计算机视觉领域取得了突破性进展和国际一线的技术水平。
但就目前国内人工智能算法的总体发展而言,工程学算法虽已取得阶段性突破,但基于认知层面的算法水平还亟待提高,这也是未来竞争的核心领域。
总的来看,虽然基础技术的成熟带来了存储容量和机器学习等人工智能技术的提升,但由于现阶段运算能力以及大规模 CPU 和 GPU 并行解决方案的局限,目前国内人工智能的发展主要集中于计算机视觉、语音识别、智能生活等方向上。
虽然目前专用化领域的场景应用仍是目前研发和投资的核心,但随着技术、数据的积累演化以及超算平台的应用,由专用化领域的场景应用向语音、视觉等领域的通用化解决方案应该在未来 20 年内成为发展的主流。
未来,随着国内人工智能行业的产业分工和企业竞合日渐明晰,国内的人工智能产业链也将更为明显地分化为以 BAT 为代表的生态平台、以科大讯飞和格灵深瞳为代表的通用技术解决平台以及以出门问问、broadlink 为代表的人工智能专用领域解决方案提供商。