阅读(1.9k) 书签 (0)

AI人工智能 概述

2020-09-24 13:35 更新

计算机视觉涉及使用计算机软件和硬件建模和复制人类视觉。 在本章中,我们将详细地学习。

计算机视觉

计算机视觉是一门学科,根据场景中存在的结构特性,研究如何从 2D 图像重构,中断和理解 3D 场景。

计算机视觉层次结构

计算机视觉分为以下三个基本类别 -

  • 低级视觉 - 它包括用于特征提取的过程图像。
  • 中级视觉 - 它包括物体识别和 3D 场景解释
  • 高级视觉 - 它包括对活动,意图和行为等场景的概念性描述。

计算机视觉与图像处理

图像处理将图像转换为图像。 图像处理的输入和输出都是图像。

计算机视觉是从其图像中构建对物理对象的明确而有意义的描述。 计算机视觉的输出是 3D 场景中结构的描述或解释。

应用 计算机视觉在以下领域中应用 -

  • 机器人领域
    • 本地化 - 自动确定机器人位置
    • 导航
    • 避免障碍
    • 装配(插入孔,焊接,喷漆)
    • 操作(例如 PUMA 机器人操作器)
    • 人机器人交互(HRI):智能机器人与人交互和服务
  • 医学领域
    • 分类和检测(例如病变或细胞分类和肿瘤检测)
    • 2D/3D 分割
    • 3D 人体器官重建(MRI或超声波)
    • 视觉引导的机器人手术
  • 安全领域
    • 生物识别技术(虹膜,指纹,脸部识别)
    • 监视 - 检测某些可疑的活动或行为
  • 运输
    • 自主车辆
    • 安全,例如驾驶员警惕性监控
  • 工业自动化应用
    • 工业检查(缺陷检测)
    • 部件
    • 条码和包装标签阅读
    • 对象排序
    • 文件理解(例如 OCR)

安装有用的包

对于使用 Python 的计算机视觉,您可以使用名为 OpenCV(开源计算机视觉)的流行库。 它是一个主要针对实时计算机视觉的编程功能库。 它用 C++ 编写,其主要接口是 C++。 可以借助以下命令来安装此软件包 -

pip install opencv_python-X.X-cp36-cp36m-winX.whl

这里X代表示机器上安装的Python版本,以及所拥有的 win32 或 64 位版本。

如果您使用的是 anaconda 环境,请使用以下命令安装 OpenCV -

conda install -c conda-forge opencv