10.计算机视觉
计算机视觉
计算机视觉的主要目标是教会计算机如何去获取图片信息中的知识,例如人脸识别就是让计算机去自动获取与识别人脸图像中的知识,这个“知识”的范畴可以是“两张图片中的人脸是否来自于同一个人”,也可以是“图片中的人脸是男人还是女人”。
维基百科上对计算机视觉的定义如下:计算机视觉是一个跨学科领域,涉及如何使用计算机获取数字图像与视频中的高层次理解。从工程角度来看,它的目标是寻找一种能够与人类视觉系统实现相同功能的自动化任务。这段话表明了计算机视觉的跨学科特点,它与人工智能、固态物理学、神经生物学、信号处理等产生诸多关联。传统的计算机视觉的处理方法多是采用信号处理方法,而机器学习技术浪潮的兴起,为计算机视觉打开了一扇新的大门。
当然,计算机视觉的数据输入源最简单和常见的就是摄像头了。但是,计算机视觉技术对于非摄像头的数据输入源也能提供很好的支持。这段话表明了计算机视觉的跨学科特点,它与人工智能、固态物理学、神经生物学、信号处理等产生诸多关联。从这个角度说,计算机视觉的技术辐射度和应用范围是非常广泛的,计算机视觉技术能够使我们的生活更加多姿多彩,为创造更美好的世界提供了一个强大的工具。
众所周知,自从 2012 年的 Alexnet 横空出世夺取当年的 ImageNet 的 svRC 挑战赛的冠军后,将这项比赛的准确率逐年提升从不到 75%近期已经达到 98%甚至 99%以上的结果,这就意昧着基于深度学习的图像分类能力已经远远超出人类肉眼的分辨能力。当前 cν 领域的深度学习主要包括两个大的方向,“低层次的感知″和“高层次的认知”。主要的应用领域包括视频监控、人脸识别、医学图像分析、自动驾驶、机器人、AR、ⅤR;主要的技术方向包括图像分类、目标检测、分割、目标追踪、边缘检测、姿势评估、理解 CNN、超分辨率璽建、序列学习、特征检测与匹配、图像标定,视频标定、问答系统、图片生成、视觉关注性和显著性、人脸识别、3D 重建、推荐系统、细粒度图像分析、图像压缩。