这两年人工智能的火热,已经从概念进入到落地的阶段,尤其是语音的人工智能音箱和机器视觉人脸识别的相关产品。早在人工智能技术兴起之前,其实业内对人脸识别技术就研发了很久,早期的技术是通过普通的摄像头,抓取图像和视频上传到到服务器,所有的识别工作由前端电脑或者服务器完成,但这样服务器的压力是巨大大,这种技术在越来越多应用场景下,效率相对较低,甚至是不合理的, 大面积推广也收到一定的限制。由于智能摄像头技术的成熟,摄像头前端具备音视频解码、传输功能之外,也集成了一些具有智能算法能力的硬件,能够识别并抓取到人脸图像,甚至通过算法提取完整的人脸特征数据(而不是图片),然后上传到服务器供后端处理,这样服务器的压力大大减小,识别的效率也就大大提升。
人脸识别系统的应用普及,尤其在机场、高铁站、银行等系统的人脸验证,大部分的老百姓,甚至一些行业从业人员,以为现在的人脸识别技术无所不能,其实应用的局限性还是很大,上个月因为工作原因,比较频繁接触了这行的兄弟,有些认知和想法给大家分享一下。
一、人脸识别技术基本现状
人脸识别技术其实早在人工智能概念之前,业内就研发了很久,早期的技术是通过普通的摄像头,抓取图像和视频上传到到服务器,所有的识别工作由前端电脑或者服务器完成,但这样服务器的压力是巨大大,这种技术在越来越多应用场景下,效率相对较低,甚至是不合理的。 因此人脸识别在前端摄像头除了具备视频传输录像功能之外,也植入了一定的智能算法,能够识别并抓取到人脸图像,并且通过算法提取完整的人脸特征数据(而不是图片),然后上传到服务器供后端处理,这样无论是服务器的压力还是识别的效率都会大大提升。目前人脸识别技术主要是如下几种情况。
1:1的比对识别
1:1比对主要是使用在身份验证上,减少人工审核,人、证合一的问题。摄像头抓到的头像与身份证中预存的头像信息进行确认,是否为同一个人。 主要场景就是机场、酒店、银行等场所,这类应用对准确率要求高,但技术的难度其实比较低,因为被验证的人都是强配合的,有充分的拍照条件,能够提供正面高清人脸图片,通过身份证号码从公安系统内部调取到人脸特征数据,这两部分数据进行一对一比对,只要达到一个重合率就通过。
产品的难点是能够获得公安部的数据授权, 目前只用公安部二所旗下的中盾公司具有独家资质,他们提供一个身份证和人脸数据读写模块,模块直接可以对接到公安部数据库, 模块的售价800~900元,绝大部分利润在这里被吃掉了。
1:N的人脸识别
这个这比较容易理解,就是从一堆的预存的人脸中,识别是对应的身份出来。最典型的就是门禁、考勤类的应用,首先要预登记每个人的人脸,摄像头抓取的图片与登记的一堆人脸进行逐个比对,判断出是哪个人。这个比对可以放在本地的服务器(通常叫识别网关),也可以放在云端进行比对,由于云服务器和万物互联的概念,所有公司一定会把人脸也保存在云端。这类系统比较重要的指标就是这个N的值(人脸数据量)。在100张人脸识别出每个人,和1万张,甚至百万张人脸去识别一个人,难度上有本质的区别。
1:∞ 无穷的识别
这个其实与1:N类似,只是这个N数量巨大,通常是公安部的数据库,通过拍照,或者人经过摄像头, 系统可以快速提取到这个人的身份信息。这个这种应用场景相对较少,技术难点也是最高的,即使人脸照片很清晰的情况下,也很难识别准确。通常用来测试系统。 通过摄像头拍照,上传图片或者人脸特征数据, 与通过公安部门的数据库比对,告知这个人是谁,相当于要在10几亿的人群中找出相同的人脸,这个并不容易,而且特征相似的人脸其实还是蛮多的,能够做按照相似度排列返回一个人员清单。我看到比较牛逼的就是深圳的警察手机APP很多都装了这 个应用,通过拍照,然后自动识别出这个人是谁,身份证号码多少等等个人信息。
二、 人脸识别的准确率
现在很多人脸识别算法或者产品都有一个重要的的指标,就是识别准确率有多高。其实单纯地讲这个准确率其实是没有意义的。
首先是这个准确率是要有前提的,摄像头的图像抓取质量高度相关,高清的正脸图片识别率肯定很高, 但如果在光线不够好,角度不是完全正面的情况下呢,这个准确率肯定是大打折扣的。
其次准确率的说法也是不严谨的。在人脸识别的时候,主要是对人脸特征数据重合率的比较,重合率达到一个阈值(例如80%),就算验证通过,这就可以通过调节这个重合率的阈值来提高准确率。 例如门禁系统,把重合率阈值设置比较低,就很容易验证通过,这样也很容易给人准确率很高的印象。但同时带来的问题就是,很多相似的脸会被错误认为验证通过。 如果调高重合率阈值,可以拒绝掉很多相似的脸,但同时本人的真脸也容易被拒绝,这个时候容易给人准确率低的印象。
这就是我们验真率和拒假率,这个指标有点类似指纹。这两个指标也基本上是矛和盾的关系。但如果一个好的算法,就会在这个点上达到一个平衡出一个最好的结果,同时在评估性能的时候,也是应该同时参照这二个指标的。
三、人工智能技术的应用
目前具有人脸算法的公司不少, 除了一些开放平台之外,提供标准算法SDK,也有很多公司自己的算法,尽管算法原理大同小异,但各家还是自己一套封闭大系统,相互并不兼容。这些算法很多得益于老美们将很多人脸数据库的特征值和算法公开后,大大降低了研发的难度。
但总体感觉上,当前大多数的人脸算法只能是一个智能系统,而不是人工智能系统,所谓的人工智能,是指能够模拟人的思维过程,通过神经网络的深度学习技术去逐渐学习,逐渐提升人脸识别的准确性。 这有点类似人的思维,当你多次使用了这个人脸识别系统后,你的数据越来越多,系统对你越来越熟悉,从而逐渐提高识别准确率。
机器学习最核心的是数据,未来这些算法公司,可能最核心的不是算法有多牛,而是你拥有多少数据,这个主要体现在二个方面,第一就是人脸数据库的量,就是拥有多少人的人脸数据,另外就是就是人脸验证的使用数据,当你的系统被使用越多,各种状态,各种光线的情况下使用,人工智能系统的算法对你越熟悉,识别将会越来越准确。
目前公安部有全国最大的人脸数据库,主要是头像图片,但数据库没有开放,必须要有甲级保密资质,一般公司没有,针对人证验证目前只用公安部二所旗下的中盾公司独家资质。对于非公安体系的民间公司来说,各家的算法公司收集人脸数据库, 除公安外的政府部门的工商,交通等也都在收集人脸,现在去银行,政府办个什么事情,都是要微信小程序预约,并且上传自己的人脸数据,腾讯,滴滴,阿里等也都在通过各种方式积累人脸数据量,例如通过手机中照片抓取人脸,你发布在QQ空间,朋友圈的自拍招聘都会被这些公司收集人脸数据库。
四、开放硬件平台的设想
当人脸识别进入到了人工智能阶段,又会进入到互联网公司的标准规则,就是强者逾强。无论是机器学习的人工智能平台,还是大数据的运营,也会变成几家公司独大,第二梯队的公司难以维系。首先通过技术形成了门槛,然后引入资金,形成资金壁垒,通过资金形成了市场壁垒,然后闭环回到继续加强了技术壁垒,造成强者恒强的局面。
刚才上文提到,人脸识别系统不是一个简单互联网系统, 而是一个软硬件高度结合的系统,既要后端服务器的算法和神经网络的机器学习能力,同时要需要前端摄像头硬件集成高度配合。这就我对硬件标准平台的摄像。
既然是开放的硬件平台,首先要满足的二个条件:
1. 极大降低系统开发的难度,提供了标准的硬件和服务器数据平台的接口。
2. 尽量是一个公立平台, 只提供标准配件,不涉及到一些具体的行业应用。
3. 有机会成为标准配件,能够快速扑向市场,收集用户和数据。
1. 标准人脸摄像头的配件
● 摄像头可以直接输出电子门锁控制信号,例如韦根接口。
● 内置人脸抓取和特征数据提取上传。
● 摄像头接入网络后,会自动在平台注册,注册内容有UUID,Product-Key等信息。● 后台操作,将注册用户与注册的摄像头进行关系绑定。
● 内置门禁接口,直接输出标准门禁控制信号。
● 从人脸识别到发出开门指令应该要小于1秒。
2. 服务器标准接口
管理后台和用户客户端为第三方合作伙伴提供标准API接口,例如:
● 通过输入摄像头系列号以及时间段,能够返回摄像头的人脸识别记录’
● 通过输入人员用户名、手机号等参数能够返回人员经过那些摄像头编号及经过时间的记录。
● 通过手机登陆注册,或者微信小程序,将个人信息和照片上传到服务器,生成人脸特征数据库。
● 用户注册人脸后,管理员可以通过后台,将注册人员与所属摄像头绑定。
● 当用户经过绑定摄像头的时候会产生相应的控制数据。
当然这些接口只是抛砖引玉,需要根据不同的行业属性完善相应的接口。
五、门禁行业的应用
上述的开放硬件接口将大大降低人脸识别行业的开放难度,一些传统的软硬件公司在这样的开放硬件平台上,能够很快完成自己的系统。
目前的人脸识别摄像头应用逐渐普及,主要分为二大类,一类是与公安部门系统对接,例维稳安保体系的人脸和身份证的验证,疑犯追逃等,另一类企业内部的独立系统,例如考勤、门禁等等。人脸识别前期最大的应用领域都是与政府部门高度相关,但这块的市场门槛很高,这个门槛可能并不是技术,而是一些大家都懂的原因。因此大量的公司都拥挤在民用领域,尤其是门禁的领域。这几年来,车辆进出的车牌识别彻底取代了IC卡,尤其在深圳几乎已经很难看到刷卡停车的地方了,在一些三四线城市,也基本上被车牌识别摄像头取代。 随着人脸识别技术的成熟,我相信禁人脸的身份识别也将会彻底取代门卡。毕竟现在连钱包和银行卡都懒得带的,更何况门禁卡,用手机APP去开门又太麻烦,而且有些老年人也不会用,因此人脸识别门禁将是一个强烈的刚需了。
现有旧小区,无论是小区大门还是单元门,都有很强烈的改造意向,但改造现有的门禁对讲系统的成本又不能太高,如果只需要在门口头顶安装一个人脸识别的摄像头,摄像头输出信号控制电锁。业主经过的时候,在1~2秒钟,摄像头识别人脸与数据库比对成功后,输出开门信号,这将会有巨大的市场。
目前有技术能力的公司都看到这市场的潜力,但还是各自为政,软件硬件都在用自己的一套,完全是自己的封闭系统,这样的研发成本很高,落地成本也很高。最近我调研了这个这块市场,我相信很快有人会要做一个开放性的人脸识别摄像头硬件,可以提供给考勤和安全门禁的行业提供基础的解决方案,从而降低研发成本和落地成本,对这市场的硬件公司也将会有一个大的洗牌。
六、后记
经过这几周的业内调研了解,这样的开放标准硬件和服务器平台其实有极大的市场,硬件平台不只提供标准模块和算法,不做自己的行业应用,提供一个简单易用的解决方案赋能给这些传统行业,依赖传统行业的渠道和落地实施。不仅仅可以在标准硬件上能够有一个大规模的销售量,同时能够大量收集到人脸数据库和使用数据,为真正的人工智能识别系统提供大数据支持,这才是算法公司的核心价值。欢迎一些有算法能力和神经网络机器学习的兄弟或者公司一起交流探讨。
作者介绍:黄小良, 深圳智安物联科技有限公司 CEO ,电子圈资深成员,5年产品研发,10年半导体分销, 5年创业,从事物联网智能家居。个人微信号“iSuren”,欢迎交流。
由ELEXCON深圳国际电子展暨嵌入式系统展和百度携手举办的“Hello AI科技联展”即将于12月20-22日在深圳会展中心2号馆举办。此前,百度AI科普大巴先后走过北京、厦门、重庆、武汉等城市,每到一处都能掀起“HELLO AI”人工智能热潮,给千万民众展示AI核心技术,感受AI生活的便利神奇。
此次ELEXCON深圳国际电子展暨嵌入式系统展上,
更有人工智能/大数据专区,让市民身临其境体验未来科技生活!
【ELEXCON携手百度掀起热潮 带您开启“Hello AI”探索之旅!】
此次,“Hello AI科技联展”,百度AI大巴惊喜亮相深圳。在百度AI大巴上,用生动有趣的互动方式展示人工智能的核心技术,基于人工智能的图灵测试、语音,图像识别、机器翻译等技术。让观众体验到炫酷的智慧生活场景,感受人工智能应用于生活的便捷神奇。
AI改变行业、改变产业,关心生活。
为人工智能疯狂打CALL!
想一探究竟?
12月20-22日来会展中心国际嵌入式电子展一探究竟,拿着地图打卡未来世界,寻宝神奇科技。
开启“Hello AI”探索之旅!
ELEXCON深圳国际电子展观众预登记正式全面启动!
多种预登记通道任你选择:
公众号菜单
“我要参观”-
“观众注册”
展会官方网站
www.elexcon.com
众多展商汇聚一堂,待看行业风起云涌!期待你的到来!
诚挚邀您莅临ELEXCON行业盛宴!