ICode9

精准搜索请尝试: 精确搜索
首页 > 其他分享> 文章详细

数据挖掘学习笔记(0)

2019-05-16 19:55:10  阅读:269  来源: 互联网

标签:Mining Data 笔记 学习 算法 数据挖掘 数据 高维


该笔记参考《数据挖掘导论(完整版)》
可见个人博客:
https://tingshushaw.github.io/2019/05/16/Data Mining/Data Mining(0)/#more

什么是数据挖掘

数据挖掘是在大型数据库存储库中,自动的发现有用信息的过程。数据挖掘是一种技术,它将传统的
数据分析方法与处理大量数据的算法相结合。

数据挖掘与知识发现

数据挖掘是数据库中知识发现(knowledge discovery in database, KDD)不缺少的部分。

数据库知识发现过程

  • 数据预处理的目的是将未加工的输入数据转换成适合分析的形式。
  • 数据预处理一般处理过程包括: 1. 数据整合(融合来自多个数据源的数据) 2. 数据清洗(消除噪音和重复的观测值) 3. 数据规约(数据的规范化)
  • 一般后处理是确保将有效的数据挖掘的结果集成到决策支持的系统当中去。在该阶段中,还能使用统计度量或假设检验删除虚假数据挖掘结果。

数据挖掘需要解决的问题

  1. 可伸缩:如果数据挖掘算法要处理海量的数据,则算法必须是可伸缩的。
  2. 高维性:数据越高维,计算复杂性迅速增加。
  3. 异种数据和复杂数据:随着技术的发展,非传统数据类型越来越多(半结构文本化,web页面集,具有三维的DNA数据等等。)
  4. 数据所有权与分布:有时候需要挖掘的数据存放站点并非一个,这就需要进行分布式数据挖掘技术。
  5. 非传统的分析:传统分析是基于假设-检验模式。当前的数据分析需要自动地产生假设以及自动评估,这促使大家开发一些数据挖掘技术。

数据挖掘的任务

四种主要任务:聚类分析、预测建模、关联分析、异常检测



标签:Mining,Data,笔记,学习,算法,数据挖掘,数据,高维
来源: https://blog.csdn.net/qq_41595507/article/details/90270223

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有