人工智能+安防:唤醒沉睡的数据,为平安城市构建“最强大脑”

新财富app(ikuyu),沟通资本与分析师的桥梁,提供有深度的见解
作者 天风证券 沈海兵团队
“算法红利”即将消失,ai产业落地时代关注三大壁垒
人工智能时代到来,各行业面临变革
2016年,人工智能的概念随着alphago打败人类棋手开始大热。以神经网络为核心算法的新一代人工智能技术已经在感知和认知的两个层面迅速超越人类——语音、图像等识别类算法以及围棋、游戏等认知类应用算法均已超越人类最佳水平。人工智能算法的进步意味着机器智能将迅速进入到生活的各个角落,并在感知和认知两个领域带来巨大的产业化机会。
图像识别作为人工智能中机器学习下神经网络算法的一大分支也逐步走进人们的生活。所谓图像识别,是指利用计算机对图像进行处理、分析和理解,以识别各种不同模式的目标和对像的技术。神经网络算法的发展中衍生出一类称为卷积神经网络(convolutionalneuralnetwork,简称为cnn)的算法。这套算法将图像信息拆解为多个层次,以人脸图像识别为例,最底层以几何图案作为最小单元,逐次组合成线条、局部图像、器官、整个人脸。cnn技术的大规模推广迅速提升了传统图像识别技术的识别正确率,并为后端应用提供了重要技术保障。
现实中图像识别技术已运用的较为广泛,“刷脸”门禁已开始普及,驾照考试中也需要人脸识别认证参考者的身份,高速公路上开始安装车辆识别摄像头。2016年4月8日,支付宝方面宣布人脸识别神器“呵呵付”(“smiletopay”)将在杭州西湖文化广场亮相。该支付认证技术由蚂蚁金服与face++合作研发。最新版本的windows10中,搭载intel的realsense摄像头的移动设备也已支持面孔认证登录。市面上不乏人脸识别的app和其他产品,人脸识别对公众来说已经不是个陌生神秘的技术了。
ai算法超人类能力,极端场景也能实现感知与认知
从技术上讲,图像识别技术可以分为两个研究前沿:通用物体识别和特定物体识别。顾名思义,通用物体识别是在一张复杂的图像中尽可能的识别更多的物体,而特定物体识别则是针对专门物体识别的技术。在特定物体识别技术中,人脸识别技术则是进步最为迅速且应用前景最为广阔的一项技术。
人脸识别的算法模型也是基于卷积神经网络,通过大量已标注的人脸图片作为素材进行训练,并形成高识别率的人脸识别模型。一般来说,一个有效的神经网络的形成需要数以万计的数据进行训练,涉及到的计算量极大。根据我们对国内一流人脸识别企业的调研,训练一个识别率较高的人脸识别模型通常需要10-100万量级的人脸图片数据、gpu服务器约为1-2周的训练时间。随着计算机计算能力的迅速提升与算法的成熟,以神经网络为核心的ai识别类算法识别率大幅提升。
在人脸识别领域,2015年-2016年期间,“实验室算法”linkface公司的deepid2、旷视科技的megvii算法、谷歌的facenet算法分别取得99.15%、99.50%和99.83%的识别准确率,超过肉眼97.50%的识别率。百度的“近实用”算法也取得了97.6%的识别准确率。
除了算法上的优化,如今的人脸识别技术还能克服光线的限制。传统的人脸识别技术主要是基于可见光图像的人脸识别,在环境光照发生变化时,识别效果会急剧下降。三维图像人脸识别和热成像人脸识别技术还远不成熟,识别效果不尽人意。迅速发展起来的一种解决方案是基于主动近红外图像的多光源人脸识别技术。它可以克服光线变化的影响,已经取得了卓越的识别性能,在精度、稳定性和速度方面的整体系统性能超过三维图像人脸识别。
此外,为解决使用静态照片或任务视频顶替身份的情况,人脸识别也采取了动态识别的技术,杜绝安防漏洞。在此基础上衍生的虹膜识别技术也逐步发展起来。
“算法红利”即将消失
作为人工智能领域里最为知名的算法比赛imagenet是目前世界上图像识别最大的数据库。这个项目是美国斯坦福的计算机科学家,模拟人类的识别系统建立的。经过2010-2015年的发展(见下图),人脸识别算法已从浅层神经网络向复杂的深度神经网络算法发展,由最初的(2012年)8层神经网络发展成为2015年的152层神经网络。而识别率也迅速的提升,由浅层网络的28.2%的错误率迅速降至3.57%。
2010-2016年,人工智能的各类算法识别率节节攀升,核心原因在于:
1.硬件算力迅速提升,特别是gpu的广泛应用,允许神经网络模型更加庞大;
2.神经网络算法本身也经历演化与自身加持,算法效率与识别率进一步提升。
时至今日,伴随着动辄1000多层的超深度神经网络模型的建立,神经网络算法已达到数据饱和状态,语音与图像的识别率进入瓶颈区域,若无算法层级上的突破,未来识别算法的效能提升将迅速边际递减。
与此同时,以谷歌研究院、微软研究院为代表的人工智能研究领军机构在算法开源化做出的努力,软件工程师可以迅速通过谷歌、微软等公司提供的人工智能开发包进行“二次开发”,实现人工智能全新领域的应用。随着人工智能研发的门槛迅速降低,全球各地打着“人工智能”旗号的创业企业如雨后春笋般的出现,并获得了资本市场追捧,人工智能市场竞争越发激烈。
国内人工智能领域创业者纷纷表示人工智能算法的优势地位顶多只能维持6个月,谷歌、百度等一众行业霸主在单个算法上也仅能保持6个月的领先。“算法红利”即将消失,如何利用算法找到用户核心痛点并付诸应用才是人工智能企业生存的法宝。
三大壁垒日益显现
人工智能的底层技术已经完成原始积累,无论从感知智能(弱智能)的各种识别算法超越人类感官,还是认知智能(强智能及半强智能)中alphago战胜李世石后,在2017年初化名为master的升级版alphago在围棋网站上先后将聂卫平、柯洁等新老棋圣斩落马下。人工智能现阶段已将其核心的深度神经网络算法打磨得无比锋利。
无数创业者和企业也迅速的组建了人工智能团队,并企图在人工智能时代分一杯羹。先是谷歌聘请深度神经网络鼻祖geoffreyhinton,facebook聘请yannlecun,百度则聘请andrewng。再有deepmind公司成立并被谷歌收购,sensetime,旷视科技等等企业开始创业,并在各自领域取得全球领先水平。
然而这些企业面临着同样的一个问题——如何将自己的技术进行产业化产品化并得到市场的认可。通过一段时间的探索,以谷歌招募李飞飞、百度andrewng离职,并开始组建以陆奇为核心的高管团队。这些事件说明,互联网龙头开始意识到算法将越来越不具备稀缺性,算法的边际改善将越来越小,这些龙头企业纷纷通过人事变动来调整自己的ai战略,并将其ai产品化作为战略方向。
在人工智能算法研发投入产出比变得不再具备经济性,且算法本身性能已经达到成熟水平的时点,ai领域的“算法红利”即将消失,我们认为数据稀缺性、产品化能力、渠道资源将构筑人工智能产业化的核心壁垒。
壁垒一:数据稀缺性
神经网络算法模型的建立,需要用大量数据进行调优与完善,一定意义上讲,进行训练的数据量越大,数据质量越好,训练得到的算法准确率越高。因此在特定领域内数据将成为稀缺资源及行业准入门槛。
从价值上观察,安防、金融、医疗这三类数据既有行业门槛,也具有极强的数据垄断性。例如安防领域,如果要进行人脸比对和身份认证,算法公司必须得到政府相关部门的授权才可以进行身份证信息提取。再者,如果人工智能诊断影像识别公司需要大量医学影像的原始数据,则需要大量懂得医学专业知识的医生或者技术人员进行前期数据标注,这样才能保证数据质量的可靠性。
海外it巨头公司已迅速在数据领域进行布局,例如ibm就于2015年8月,以10亿美元收购了医学成像及临床系统供应商mergehealthcare,进一步完善其医疗大数据拼图;2016年年初,斥资26亿收购健康数据公司truvenhealth,该公司拥有8500家客户,其中包括美国联邦政府和州政府机构、雇主、医保、医院等,以及3亿病人数据。此外truven还拥有2500名雇员,其中包括有数据科学家、研究人员以及各类专家等,这些都是ibmwatsonhealth要想真正发挥作用必不可少的资源。
反观中国市场,中国在数据角度拥有无法比拟的优势:人口基数多。例如,中国医生人均门诊接待人数约是海外医生的10倍,这些数据既能成为人工智能模型的原始数据,也能成为成熟模型的最终消费用户。
壁垒二:产品化能力
人工智能的应用涉及到较多工程性的产品化能力,这也将成为人工智能企业赖以生存的核心竞争力之一。例如支付刷脸的人脸识别系统中,算法公司通过不断试错,成功的将刷脸支付流程中加入了“活体验证”(眨眼、转头等证明用户是活人而不是照片)的过程。
中国企业相比于海外公司具有更强的工程化、订单制研发能力。产品化能力一方面能补全部分“后进”公司在算法效率上的微弱劣势,另一方面可以极大提升垂直场景中的功能与效率。从技术上而言,几乎所有人工智能创业公司均具有相关算法能力,但融入到具体场景应用中时,工程及产品化能力将成为企业绕开“路障”的一个法宝。
壁垒三:渠道优势
我们认为,人工智能技术将率先应用于tog、tob端应用,而toc端应用较为滞后。核心原因在于,tog、tob领域的场景往往较为单纯,业务重复度较高,因此人工智能有望迅速提升业务效率,减少人工投入。toc端应用由于需要根据个人用户进行个性化定制和调整,在人工智能早期,数据体量不足的情况下往往体验较差,很难大规模推广。
tog、tob领域当中,人工智能技术已在安防、教育、金融等多个领域开始出现大规模订单落地情况。初期订单的落地将大大降低商业模式门槛,并形成“雪球效应”:大规模的应用也将积累大量数据,反过来迅速提升模型精确度。渠道优势的这种“雪球效应”所带来的先发优势,将成为人工智能企业的核心优势。
人工智能技术赋能安防行业,打开市场增长空间
高清摄像头升级为“ai+安防”提供可能性
总体来说,我国的视频监控行业经历四个阶段:起步阶段,传统模拟监控,国内自主知识产权落后,安防系统用户局限于政府部门;发展阶段,数字监控,安防用户增多,监控规模扩大,图像数字化储存,分辨率迈入标清时代;提高阶段,高清化监控,市场容量持续增加,视频监控系统与用户业务系统融合;智能化阶段,逐步形成集数据传输、视频、控制于一体的智能化安防综合管理平台。
中国目前正处于高清化监控的提高阶段,此阶段的市场容量持续增加,视频监控系统与用户业务系统融合。随着视频监控技术的升级,安防行业的智能化也迅速到来。与此同时,硬件设备性能的提升也为人工智能应用提供了重要保障。
图像识别功能所采用的深度神经网络算法是采用大量训练集数据进行模拟和调优所构建的。这就意味着人工智能图像识别技术的运算与应用离不开大量数据的支持,为模型提供的图像信息越丰富、像素越高、清晰度更高,越有助于图像识别准确率的提升。
作为行业的重要发展方向,未来的安防行业必定是高科技云集的行业,ai+安防的组合模式为行业发展最终步入智能化阶段提供动力。
视频监控的高清化
监控摄像头的高清化是实现摄像头网络化和智能化的重要前提:从标清到高清的跨越,实现了视频监控从“看得见”到“看得清”的转变。高清晰度图像可以提供更多关键性的细节,单个监控点的监控幅度扩大,还可以提高智能视频分析的精度,为智能监控奠定基础,高清化势在必行。
模拟摄像头的清晰度远远低于网络摄像头,但是网络摄像头的推广却受到阻碍,推广最主要障碍来自于产品价格。从我国视频监控龙头企业海康威视系列产品的价目表来看,更为清晰的网络摄像机价格均高于模拟摄像机,400万像素的网络摄像机价格是模拟摄像机的2到4倍。但随着科技的不断进步,相信不久的将来这一障碍预计会逐渐消除。
码率不断降低
提升编码效率是实现视频高清化的另一项技术基础,编码效率的提升意味着高清图像占据的储存空间下降,传输速度上升。这一过程目前主要分为h.264到h.265,h.265到smart265两阶段。
首先是从h.264到h.265,做到了同一清晰度下编码空间占用降低50%以上,此外h.265还具有压缩率高、稳定性好、错误恢复能力强,并在实时时延、信道获取时间、随机接入时延等多个有点,整体改善改善。
h.265到smart265:在保证图像质量的前提下,编码使用更低的码率,极大地放宽了对传输带宽的要求,节省了存储空间。
ai赋能安防,点线面全维度布防
在众多tog、tob领域,我们认为安防行业有望率先成为ai产业化的第一站。核心原因在于:
1.算法成熟:安防行业场景较为集中,容易实现技术优化与突破,目前图像识别算法已达到安防应用要求
2.需求明显:政府安防领域效率提升诉求较强,安防正向全时间全地域维度扩展
3.基础稳固:政府一直大力投资安防领域,全国过半摄像头已完成高清摄像头部署,警务电子化与信息化已逐步完成,为�...
关于本站