ICode9

精准搜索请尝试: 精确搜索
首页 > 其他分享> 文章详细

计算机视觉-前言

2021-11-21 11:02:31  阅读:122  来源: 互联网

标签:前言 特征 分类 损失 分类器 图像 视觉 方法 计算机


计算机视觉


图像识别中首先应该看到哪些信息?

答:1. 三维场景的结构信息。比如让机器人可以在街道上正常的在道路上邢进而不会去撞击建筑物。2. 理解寓意概念。能够分辨出场景中的例如垃圾桶、人、车等都是些什么东西。

 

1. 什么是图像分类任务,它有哪些应用场合?


图像分类任务是计算机视觉中的核心人物,其目标是根据图像信息中所反映的不同特征,把不同类别的图像区分开来。

 

 

2. 图像分类任务有哪些难点


 

3. 基于规则的方法是否可行?


通过硬编码的方式识别猫或者其他类,是一件很困难的事情。因为猫的形变很大,所以这种方式不适合形变很大的物体。

4. 什么是数据驱动的图像分类范式?


数据驱动的方法时最流行的方法。

第一步,数据集构建。第二步,分类器设计与学习。第三步,分类器决策。

 

分类器设计与学习:首先输入图像X,然后对图像进行表示,将图像表示传入分类模型中,无论分类模型的好坏都会有一个预测值,将预测值与真实值进行比较会用到损失函数,从而产生损失值, 然后利用损失值通过优化函数来更新模型的参数。

 

图像表示的主要方法:1. 像素表示,就是通过三通道RGB来表示。2. 全局特征表示,从整图像中抽取特征,比如GIST特征(频率特征),这种方法比较适合风景类、室内场景以及城市建筑等大场景的分类。全局特征就是在计算的过程中要依赖所有的像素。3. 在考虑遮挡情况影响的时候,我们更多的是考虑使用局部特征。比如SIFT特征+词袋模型。

以上现在主要是用的依旧还是像素表示,因为深度学习神经网络的出现。

分类器:近邻分类器、贝叶斯分类器、线性分类器、支撑向量分类器、神经网络分类器、随机森林、Adaboost。

损失函数:0-1损失、多类支撑向量机损失、交叉熵损失、L1损失、L2损失。

优化方法:一阶方法:梯度下降、随机梯度下降、小批量随机梯度下降。二阶方法:牛顿法、BDGS、L-BFGS。

训练过程:数据集划分;数据预处理;数据增强;欠拟合与过拟合:减小算法复杂度、使用权重正则项、使用dropout正则化;超参数调整;模型集成。

5. 常用的分类任务评价指标是什么?


正确率、错误率。

 

标签:前言,特征,分类,损失,分类器,图像,视觉,方法,计算机
来源: https://www.cnblogs.com/codezzlove/p/15583767.html

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有