车牌识别是一项利用车辆的动态视频或静态图像进行牌照号码、牌照颜色自动识别的模式识别技术。其硬件基础一般包括触发设备(监测车辆是否进入视野)、摄像设备、照明设备、图像采集设备、识别车牌号码的处理机(如计算机)等,其软件核心包括车牌定位算法、车牌字符分割算法和光学字符识别算法等。一个完整的车牌识别系统包括车辆检测、图像采集、车牌识别等几部分。当车辆检测部分检测到车辆到达时触发图像采集单元,采集当前的视频图像。车牌识别单元对图像进行处理,定位出牌照位置,再将牌照中的字符分割出来进行识别,然后组成牌照号码输出。传统车牌识别以数字图像技术、模式识别为基础,主要涉及图像处理领域。在人工智能和深度学习快速发展的背景下,近年计算机视觉领域中卷积神经网络在目标检测、图像识别、分类等任务中火放异彩,为车牌识别技术提供了新的研究方法。
车牌识别技术的研究最早出现在 20 世纪 80 年代,当时只是初步的构思与设计,并没有系统的实现。随着计算机视觉领域的发展,开始了全球性的研究热潮,机器视觉获得了蓬勃发展,新的概念、新的理论也不断涌现。人们对其开始了广泛的研究,当时主要途径就是采用简单的图像处理方法来解决相应的问题,最大的特点就是人工干预性较强。到了 20 世纪 90 年代,较为典型的是A.S.Johnson 等提出的图像特征提取,图像分割,图像字符的识别等三个部分构成了完整的车牌自动识别系统,后期出现了图像视觉领域中的字符识别技术(Optical Character Of Recognition Technology),它是通过图片中的二值化算法来定位车牌,然后利用边界纹理特征对字符的提取,再利用最邻近算法分类器,得出车牌的候选号码,最终在对这些候选号码进行检查核实。这个时期对车牌的定位与识别在准确率上有较大的突破,但在识别的速度上有待提高。
随着计算机技术的不断发展,计算能力也有了大幅度的提高,目前在人工智能领域中,深度学习技术是这一领域中的重大突破。2012 年,在 ImageNet 图像识别比赛中,杰弗里·辛顿带领的团队采取卷积神经网络模型 AlexNet一举夺冠,AlexNet 采用的是 ReLu 激活函数,从根本上解决了当时所遇到的梯度梯度消失问题,并且通过硬件 GPU 来提高训练模型的运行速度。同一年,斯坦福大学的吴恩达教授带领团队将深度神经网络—DNN 应用于图像的识别领域上,并取得了惊人的成果,在 ImageNet 测评中将原有的错误率从原先的 26%降为 15%。自此之后,深度学习技术脱颖而出,受到大量学术界和公司科研团队的关注。随着深度学习的不断进步,使得数据处理能力显著提高。2014 年,Facebook 公司利用深度学习算法成立了 DeepFace 项目,在人脸识别领域上将准确率提升到了97%以上,再一次证明了深度学算法在图像识别领域的一骑绝尘。2016 年,谷歌公司利用深度学习算法开发的 AlphaGo 在国际顶尖的围棋比赛中,以 4:1 战胜了韩国选手李世石,使全球范围内对深度学习的热度再次掀起,这也证明了深度学习技术已经超越了人类。伴随着图像分类任务,图像检测是指在分类图像的同时把物体用矩形框给圈起来。14 年到 16 年之间,Girshick 等人打破了当时机器学习的僵局,最先提出了区域块卷积神经网络目标检测算法R-CNN,自此,目标检测在机器学习领域中开始了前所未有的迅速发展。对于数据集 VOC07 上,R-CNN 对目标的检测可以达到惊人的效果。2015 年,Ren等人在 R-CNN的算法基础上,右提出了一种改进了的 Fast-RCNN,实现了多个任务,多个学习方式,并且训练数据集的速度是 R-CNN 的 9 倍左右,其检测速度相当于 R-CNN 检测速度的 200 倍。同一年,由 Joseph 和 Girshick 等人提出了一体化卷积神经网络检测算法 YOLO,该算法能够在 GPU 环境中速度为 45 帧/秒,其最快的版本速度可以达到 155 帧/秒(640×480 像素)。紧接着,yolo的升级版yolov2和yolov3分别在2016年和2018年问世,通过加入batch normalization和dimension cluster技术,使得目标检测技术在速度、分类数、精度等方面都有了较大提升。在文本识别领域,由华中科技大学白翔团队在2015提出的CRNN算法时至今日仍在被广泛应用,CRNN使用CNN+RNN+CTC的网络结构,在IIIT5K、SVT和IC03数据集上的表现都优于其他传统算法。
基于深度学习的智能车牌识别系统
2023-10-09 10:40:15
项目
1281