计算机视觉是一门关于如何运用照相机和计算机来获取我们所需的,被拍摄对象的数据与信息的学问。形象地说,就是给计算机安装上眼睛(照相机)和大脑(算法),让计算机能够感知环境。我们中国人的成语"眼见为实"和西方人常说的"Onepictureisworthtenthousandwords"表达了视觉对人类的重要性。不难想象,具有视觉的机器的应用前景能有多么地宽广。
正如人类认识世界的信息91%来自视觉,计算机视觉是机器认识世界的基础。当前计算机视觉主要应用在人脸识别、图像识别方面。计算机识别的图像一类为静态内容,比如图片,另一类为动态,比如视频和实景,实景识别需要利用传感器技术进行采集编码。通过将采集的信息进行提取和处理传输到学习平台进行训练,提高识别精度后进行信息反馈。
国外巨头发力布局视觉技术,升级自身产品。Google的CloudVisionAPI帮助开发者创建具有视觉识别功能的APP,微软小兵商业平台发布图像识别功能,Amazon收购图像识别公司等等。
国内三大BAT也基于自身产品进行产业布局。百度布局较广,在无人驾驶、医疗、金融领域均有涉及,阿里主要基于其淘宝、支付宝产品进行计算机视觉技术升级,腾讯 密切关注海外相关公司发展寻找投资标的。
计算机视觉技术应用场景广泛,安全、娱乐等领域最先实现落地商业化,包括智能安防、直播监管、视频平台营销、金融服务安全分析等,还可以与其他技术综合结合应用,如AR、ADAS无人驾驶、疾病辅助检测等。