谷歌最近发布了一款为移动GPU推理量身定制的轻量级人脸检测器——亚毫秒级人脸检测算法BlazeFace。它可以在旗舰设备上以200-1000+fps的速度运行,可以应用于许多需要快速准确识别人脸区域的任务,如2D/3D人脸关键点识别和几何评价、人脸特征和表情分类、人脸区域分割等。
说到“人脸识别技术”,我想大家都不会觉得奇怪。"人脸识别技术自20世纪60年代末研发以来,到了90年代才逐渐进入市场,技术的准确率也逐渐达到99%。一些人脸识别软件在国际标准LFW数据库中甚至达到了99.15%的准确率,已经超过了人眼的识别能力。正因为如此,各行各业都将人脸识别带入了未来的规划前景,尤其是AI领域的企业,如迪法恩科技、易图科技、极地链条科技等,都渴望尝试这一点。
AI,人脸识别背后的推动者?
在人脸识别技术发展之初,一个典型的基于视频图像的人脸识别系统一般会自动检测人脸区域,从视频中提取特征,最后识别出是否存在人脸的身份。在视频监控、信息安全和门禁应用中,基于视频的人脸识别是一个非常重要的问题,也是目前人脸识别的热点和难点。基于视频的优于基于静态图像的,因为布鲁斯和奈特已经证明,当一张人脸被反转或倒置时,运动信息有助于人脸识别。虽然视频人脸识别是基于静态图像的人脸识别的直接扩展,但一般认为视频人脸识别算法需要同时使用空间和时间信息,而这类方法直到最近几年才受到重视,需要进一步的研究和发展。
目前,视频人脸识别仍然存在许多困难和挑战。具体来说,视频图像的质量比较差:视频图像一般采集在室外(或者室内,但是采集条件比较差),通常没有用户的配合,所以视频人脸图像往往会有很大的光照和姿态变化,也可能会有遮挡和伪装。
第二,人脸图像相对较小:同样,由于采集条件较差,视频人脸图像一般小于基于静态图像的人脸识别系统的预设尺寸。小尺寸图像不仅会影响识别算法的性能,还会影响人脸检测、分割和关键点定位的准确性,这必然会导致整个人脸识别系统的性能下降。
在这种情况下,提高系统识别的精度和准确度显然成为人脸识别领域的一项紧迫任务。如何利用人工智能有效地促进人脸识别的发展,已经成为人工智能视觉和图像领域的一个关键应用。
AI,人脸识别背后的推动者?
比如视频AI领域的独角兽极链技术提出了四个模块来识别场景中的人脸:
模块1:视频结构化,将视频分成镜头。
在这个过程中,通常采用全局特征和局部特征相结合的方法。全局特征检测全局颜色分布的突变,然后利用局部特征获得的人脸识别跟踪结果和跟踪轨迹的不连续性来判断视频是否有镜头切换。跟踪判断镜头切换有很大的优势,因为后面的步骤会采用类似的算法,所以这一步需要的算法是可以重用的。
模块2:人脸轨迹提取。
镜头分割完成后,可以在单个镜头中提取人脸轨迹。在轨迹提取算法中,还应考虑精度和速度指标。要实现速度和精度的平衡,有两种方式:间隔采样或逐帧处理,以及检测和跟踪的配合。
模块3:人脸识别。
一旦我们有了人脸轨迹,我们就可以开始识别人脸了。但是,在将人脸数据输入到深层网络之前,需要对其进行转换和处理。转型的一部分很重要的是人脸,尤其是消费视频,就是人脸对齐。人脸对齐是通过检测和定位人脸的特征点,将各种姿态的人脸图像恢复和校正为正面人脸的过程。在算法框架中,需要加入人脸质量评估算法,过滤低质量的人脸图像,保证人脸数据的准确性。
在样本充足的前提下,可以利用训练好的模型从人脸样本中提取特征。测试时,将视频中检测到的人脸输入到生成的特征向量中,并与人脸的交互特征向量进行匹配,找到特征空间中最接近的样本。
模块4:识别结果的融合。
上面说的人脸识别是针对单帧识别图片的,前面说的系统识别结果是针对整个人脸轨迹的。因此,最后需要将人脸识别的结果与整个人脸轨迹融合,得到整个轨迹的识别结果。
识别结果的融合策略有很多。简单的投票策略,即尾框的识别结果为一票,识别结果中票数最高的一票为轨迹的最终识别结果。神经网络也用于实现这种融合,它可以在时间维度上训练一个神经,将每帧中识别的特征向量作为网络的输入,通过时间维度上的一系列参数变换得到最终的特征向量。
如果说AI是时代的潮流,那么人脸识别就是乘风破浪的小船。今天,随着人工智能的发展,人脸识别可以有更高的准确率、更强的识别能力和更广阔的前景。
成都融和实业排队叫号系统厂家是一家集研发、生产、营销、服务于一体的高新技术企业.主营智能排队叫号系统、排队机、叫号机、评价器、呼叫器、多媒体查询及信息发布配套系统等,公司产品已广泛应用于不动产登记、智慧税务、智慧政务、智慧金融、智慧医疗、智慧通讯、智慧服务大厅、智慧机关单位等服务窗口行业.咨询电话:028-87438905。