ICode9

精准搜索请尝试: 精确搜索
  • 数据分析——统计学多指标统计方法2022-01-30 14:00:19

    一、多变量分析方法的选择 https://pan.baidu.com/s/1ogCfSwcNvxlJXPhPzeHlGQ 提取码: qs3d; 分析的目的:区分有监督分析和无监督分析 1、有因变量,则建立有监督模型; 1)因变量为连续变量(建立的模型称为回归预测模型),自变量为连续变量时,可选择回归分析、方差分析;自变量为分类变量或

  • 无限偿债之数据分析统计学的笔记2021-10-17 14:33:49

    无限偿债之数据分析统计学笔记     统计学的本质 统计分析的目的 收集数据、整理分析数据和由数据得出结论的一组概念、原则和方法   描述统计:利用表格。图形或者数值(数值特征)来展示和刻画数据中的信息   推断统计:利用样本获得的数据对总体的性质进行估计或者检验,总体的性质

  • SPSS的K均值聚类、分层聚类、二阶聚类有什么区别2021-10-08 13:33:54

    K均值聚类、分层聚类、二阶聚类是SPSS聚类分析中常用的三种聚类方法。K均值聚类使用的是欧式距离的测量方法;分层聚类是根据度量的距离远近,构建谱系分析;二阶聚类是利用距离测量得到分类树,然后再利用BIC或AIC准则判别最佳聚类。 除了以上聚类原理的不同外,三种聚类方法还有哪些不同

  • 连续变量离散化的原因2021-09-03 12:02:26

    连续变量为啥要进行离散化 参考:https://www.cnblogs.com/wqbin/p/11087162.html 一、离散化原因 数据离散化是指将连续的数据进行分段,使其变为一段段离散化的区间。分段的原则有基于等距离、等频率或优化的方法。数据离散化的原因主要有以下几点: 算法需要 比如决策树、朴素贝叶斯

  • 统计学习的对象2021-07-05 17:33:06

    1.统计学习的对象是数据 2.从数据中提取特征,然后抽象出数据模型,然后又回到对数据的分析与预测中 3.数据是多样化的,比如文字、图像、视频、音频数据以及它们的组合   4.学习的前提是同类的数据并具有一定的统计规律 5.同类数据是指具有某种特性的数据,比如英文文章,互联网网页,数据库

  • R语言逻辑回归分析连续变量和分类变量之间的“相关性“2021-05-12 14:02:09

    原文链接:http://tecdat.cn/?p=18169   比如说分类变量为是否幸存、是因变量,连续变量为年龄、是自变量,这两者可以做相关分析吗?两者又是否可以做回归分析? 我们考虑泰坦尼克号数据集, titanic = titanic[!is.na(titanic$Age),] attach(titanic)  考虑两个变量,年龄x(连续变量)和幸

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有