标签:机器 变量 回归 回归方程 学习 可视化 单选题 方法 可以
1.【单选题】下面哪个回归分析的说法是正确的( )。
A、回归分析是分析一个变量与其他一个(或几个)变量之间的线性关系的统计方法
B、回归分析不需要样本训练
C、不可以预测非数据型属性的类别
D、非线性回归方程一般要转化为线性回归方程才比较容易求解其中的参数
解:D
回归分析不仅仅能分析线性关系,应用于线性关系的回归分析称之为线性回归分析。
回归分析属于机器学习,同样需要样本进行训练。
回归分析可以预测非数值型属性的类别,可以通过将这些值转化为可以计算的离散型数据进行对应计算后,然后就可以得到对应的类别。
非线性回归方程通常来说较为复杂,转化为线性回归方程后比较容易求解其中的参数。
2.【单选题】分析营销投入与销售收入的关系可以使用下面哪种数据挖掘方法( )。
A、关联分析
B、回归分析
C、聚类方法
D、推荐算法
解:B
分析营销投入和销售收入之间的关系,我们可以使用回归分析的方法,拟合为一条直线进行求解。
3.【单选题】
有关回归模型的系数,以下说法错误的是哪个( )。
A、一元线性回归模型的系数可以使用最小二乘法求得
B、多元回归模型的系数可以使用梯度下降法求得
C、一元线性回归模型的系数大小和正负说明自变量对因变量的相对影响大小
D、回归分析的目的是计算回归方程的系数,使得样本的输入和输出变量之间的关系能够合理拟合
解:B,B不是严格错误的。
一元线性回归模型的系数可以使用最小二乘法求得。
逐步回归分析法是多远线性回归的分析方法之一。但多元回归模型的系数可以使用梯度下降法求得,使用的是偏导数来进行下降。代码参照https://zhuanlan.zhihu.com/p/33442801。
一元线性回归模型的系数大小和正负说明了自变量对因变量的相对影响大小,正确。
回归分析的目的是计算回归方程的系数,使样本的输入和输出变量之间的关系能够合理拟合,正确。
4.【单选题】
对于非线性回归问题,以下说法错误的是哪个( )。
A、可以分别求单个自变量与因变量的回归方程,然后简单求这些方程的加权和
B、非线性回归方程的系数需要把其转化为线性回归方程才方便求解
C、非线性回归模型的检验也可以使用R2
D、Logistic回归是一种典型的广义线性回归模型
解:A
因变量的改变是由于多个自变量同时作用导致的,先求解出单个自变量与因变量的回归方程,再进行方程的加权和是没有办法得到对应的方程。忽略了自变量间的影响。
非线性回归方程的系数需要把其转化为线性回归方程才方便求解,正确。
非线性回归模型的检验也可以使用R2。R2的通俗解释,是说明了自变量对因变量的解释程度,R2高,则说明了自变量解释了大部分的因变量的数字特征。当然,首先要排除了共线和伪回归的情况下。
Logistic回归是一种典型的广义线性回归模型,正确。
5.【单选题】下面关于主成分分析PCA的描述中错误的是( )。
A、PCA是从原空间中顺序找一组相互正交的坐标轴
B、原始数据中方差最大的方向是第一个坐标轴
C、基于特征值分解协方差矩阵实现PCA算法
D、奇异值分解只能适用于指定维数的矩阵分解
解:D
PCA主成分分析是从原空间中顺序找一组相互正交的坐标轴,正确。PCA通过这种方式可以实现数据降维。
原始数据中方差最大的方向,也就是蕴含信息最多的方向,是第一个坐标轴。
基于特征值分解的协方差矩阵实现PCA算法。
奇异值分解对矩阵的维度没有特别的要求。任意矩阵局可以进行奇异值分解。
6.【单选题】
下面关于奇异值分解(SVD)的描述中错误的是 ( )。
A、奇异值分解就是把一个线性变换分解成两个线性变换
B、奇异值往往对应着矩阵中隐含的重要信息,且重要性和奇异值大小正相关
C、SVD是对PCA的改进,其计算成本更低,相同之处是两者的目标都是为了降维
D、奇异值不仅可以应用在数据压缩上,还可以对图像去噪
解:无
奇异值分解应该就是把一个线性变换分解成两个线性变换,一个线性变换代表旋转,另一个代表拉伸。
奇异值往往对应着矩阵中隐含的重要信息,且重要性和奇异值大小正相关。每个矩阵A都可以表示为一系列秩为1的“小矩阵”之和,而奇异值则衡量了这些“小矩阵”对于A的权重。
SVD是对PCA的改进,其计算成本更低,且两者君为了降维,正确。
奇异值分解不仅可以使用在数据压缩上,还可以对图像去噪,正确。参考矩阵奇异值分解与照片压缩、去噪_lxy的学习笔记-CSDN博客
7.【单选题】下面有关线性判别分析错误的说法是哪个( )。
A、通过对原始的数据进行线性变换,使得不同类的样本尽量分开
B、线性判别分析中线性变换可以使同类样本的方差变大
C、线性变换可以使不同类别样本的距离加大
D、提高不同类样本的可分性
解:B
通过对原始数据进行线性变换,使不同的样本尽量分开,正确。
线性判别分析中线性变换可以使同类样本的方差变小。
线性变换可以是不同类别样本的距离加大,正确。
提高不同类样本的可分性,正确。这个是所有分类算法的目标。
8.【单选题】平面图中的老鹰能够被人们识别的原因是( )。
A、体积大
B、为人所熟知
C、长得有个性
D、观察角度合适
解:D
因为观察角度合适,我们可以获取最多的信息,让我们判别老鹰。
9.【单选题】假设样本数大于维数,利用PCA技术,可以把N维数据降到( )。
A、只能到1维
B、只能到N-1维
C、1到N-1维
D、取决于样本的类别数
解:C
PCA降维可以把N维数据降到1到N-1维。
10.【单选题】特征选择与特征提取的关系是( )。
A、特征提取包含特征选择
B、特征选择包含特征提取
C、一码事,说法不同而已
D、It is like comparing apples and oranges
解:A
特征提取包含了特征选择。
11.【单选题】下面哪种可视化方法比较适合聚类分析( )。
A、直方图
B、散点图
C、条状图
D、箱图
解:B
使用散点图能尽可能地描述数据的分布情况,因此更加适合于聚类分析。
12.【单选题】以下有关可视化认识错误的是哪个( )。
A、可视化是简单地把原始的数据用图的形式展示出来的方法
B、可视化可以作为数据预处理的一种方法,找出其中的噪声
C、可视化本身是一种数据分析方法,使用图表把数据中隐藏的规律展示出来
D、通过数据的可视化,可以促进数据分析人员对数据的认识和规律发现
解:A
可视化不单单能将原始数据用图的形式展示出来,而且可以根据我们需要进行的任务不同描述原始数据的不同特征。
可视化可以作为数据预处理的一种方法,找出其中的噪声,正确。例如,箱尾图中就包含了异常点。
可视化本身是一种数据分析的方法,使用图表把数据中隐藏耳朵规律展示出来,正确。
通过数据的可视化,可以促进数据分析人员对数据的认识和规律发现,正确。
13.【单选题】对在线教学的学生数据做分析,下面那个选项不是可视化的作用( )。
A、可视化可用于分析不同类别学生的学习轨迹(流程)
B、可视化可以动态展示不同时期学生群体的学习行为
C、可视化可以帮助发现有问题的学生,从而可以提前做学情预警
D、可视化可以预测一个刚选课不久的学生完成一门课程所需要的时间
解:D
预测一个刚选课不久的学生完成一门课程所需要的时间,这属于一个预测任务,需要我们建立对应的模型。可视化不能直接进行预测。
14.【多选题】下面有关箱图(盒图)的作用,正确的是哪些( )。
A、作为一种常用的可视化图形,它可以展示一个变量(例如房价)的平均值、上下四分位等统计值
B、箱图可以用于分析某个变量的不同取值对另一个变量影响的程度
C、通过比较不同影响变量(对被影响变量)的箱图,可大致确定这些变量的相对重要性
D、箱图可以了解一个变量的分布以及噪音情况
我的答案:B
箱图不能直接展示平均值
箱图可以用于分析某个变量的不同取值对另一个变量影响的程度,正确。
通过比较不同影响变量(对被影响变量)的箱图,可大致确定这些变量的相对重要性,错误。因为忽略了不同变量之间的影响,因变量是同时收到自变量的影响的。
箱图可以了解一个变量的分布以及噪声情况。箱图不能很好地对噪声情况进行分析。
标签:机器,变量,回归,回归方程,学习,可视化,单选题,方法,可以 来源: https://blog.csdn.net/qq_37402392/article/details/118072282
本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享; 2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关; 3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关; 4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除; 5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。