Allion Labs / Kali Chen
什么是智能影像侦测?
智能相机在近年经由学术单位大量研究与扩展让影像侦测技术更上一层楼,因其功能卓越及使用便利,也逐渐成为许多家庭必买的智能用品之一。简单来说,智能影像分析系统会透过计算机视觉、机器学习与深度学习等技术,从中学习人的视觉识别能力,并自动判读影像中的关键信息,目前被大量使用在人脸识别、人体动作捕捉、光学文字识别技术等。此外,智能相机也导入了云端系统,使数据可以循环储存在云端上,搭配网络平台上导入的识别技术,无需额外再架设主机或储存设备,从而减少设备的开销。
市场常见的四大影像识别软件与平台
百佳泰从市面上常见的影像识别软件,分别介绍其功能及原理:
- 人脸侦测
- 人体动作侦测
- 车辆识别
- 光学文字识别功能
人脸识别
人脸识别是智能相机中最重要的一部分,其原理为当相机取得人脸影像后,会取得人脸五官相对位置的坐标。我们以知名影星为例(图1.1),从照片中撷取眉毛、眼睛、嘴部等多点位置后,描绘出多点所形成的轮廓;如拍摄到数张同一人脸在不同角度的影像时,软件会利用神经网络处理图片,从中提取特征点,并将其数张影像代入机器学习算法,可训练分类器分类以及训练出人脸身份对应的模型。
图1.1:将不同角度的同一人脸导入侦测系统进行训练
当下一次再拍摄到同一个人的人脸时,侦测系统便会代入之前训练好的模型,便可准确辨认出该人的身份(如图1.2)。
图1.2
此外,这一系列的技术也可运用在实时视频中,影像侦测透过模型可迅速识别人员身份(如图1.3)。
圖1.3
人体动作侦测
在居家环境中,婴幼儿及老人的居家照顾较为费心;如稍不注意,可能会导致婴儿跌落床下或是老人跌倒等情形发生。智能摄影机另一项着重的功能在于可侦测人员防跌以及防摔,镜头会侦测人员的肢体由直立快速改变为平躺或卷曲状的动作。另外像是运动训练单位所使用的智能摄影机,也搭配了肢体捕捉功能,可精准进行动作肢体的校正。目前肢体捕捉最主流的为Open Pose,识别的原理先由相机捕捉到2D图像并传到网络平台数据库,图像数据再导入Open Pose运算平台,之后Open Pose中的关键点检测器会识别并标记出身体特点的部位,身体跟踪算法会计算出不同角度下每个姿势的表现,并以3D彩色火柴人的形式呈现出来。 (图2)
图2
车辆识别
在交通管理工作领域中,车辆识别是相当实用的功能,例如停车场停车、路边违停、超速等交通安全事件,往往都需要拍摄车牌号码取得证据。不同地区的国家有不同车牌格式,当摄影机拍下车牌影像后会立即上传到平台数据库。就目前来说,网络平台上Open ALPR可针对不同地区的车牌格式进行训练并储存模型,当用户上传数据到平台时便能快速识别该车牌,并提供车辆型号、年分、厂牌、车牌号码等信息。
图3
光学文字识别功能
利用图像识别的方式撷取文字信息,可以大量应用在各种场合,例如各种有文字信息的图像、光学文件扫描仪、文字翻译机等。目前较为广泛使用的是Tesseract的OCR技术,在网络平台先建置并设定好使用的文字语系模型,再输入含有文字的影像和模型比对,即完成文字识别输出(图4)。
图4
百佳泰四大影像软件验证服务
百佳泰与时俱进,导入四大影像识别验证测试,确保您的产品可针对不同目标进行精准识别与校正,除可保有良好的产品质量外,也能在市场中占据一席之地。
以下为智能摄影机验证项目其具体方法(表1)
验证项目 | 验证方法 |
人脸识别验证 | 脸部影像捕捉传送至网络平台,导入 Face API 侦测功能,回传侦测结果并实际比对该厂牌智能相机APP端的人脸识别功能。 |
人体动作侦测验证 |
人体影像捕捉传送至网络平台,导入 OpenPose侦测功能,回传侦测结果并实际比对该厂牌智能摄影机APP端的人体动作侦测功能。 |
车辆识别验证 | 车辆影像捕捉传送至网络平台,导入Open ALPR侦测功能,回传侦测结果并实际比对该智能摄影机APP端的车辆识别功能。 |
光学文字识别功能验证 |
文字影像捕捉传送至网络平台,导入 Optical character recognition (OCR) API 侦测功能,回传侦测结果并实际比对该厂牌智能摄影机APP端的光学文字识别功能。 |
表1
此外,我们参考市面上三大热门网络平台供货商(表2),透过平台搭配能为您的产品架构出最佳智能影像识别测试方案。
微软 | 亚马逊 | ||
网络平台 | Azure Computer Vision | AWS Rekognition | Cloud Vision |
表2