标签:知识点 项目管理 数据库 系统集成 2022 数据挖掘 数据
很多考生在备考2022年系统集成项目管理工程师考试,为大家整理了2022年系统集成项目管理工程师考试知识点:大数据,供大家备考复习。
大数据
大数据是指无法在一定时间内用常规软件工具对其内容进行抓取、管理和处理的数据集合。大数据技术,是指从各种各样类型的数据中,快速获得有价值信息的能力。
适用于大数据的技术,包括大规模并行处理(MPP)数据库,数据挖掘电网,分布式文件系统,分布式数据库,云计算平台,互联网,和可扩展的存储系统。大数据的特点5V:Volume大量、Variety多样、Value有价值、Velocity高速和Veracity真实性。
大数据关键技术:
①HDFS:能提供高吞吐量的数据访问,非常适合于大规模数据集上的应用。
②HBase:不同于一般的关系数据库,是非结构化数据存储的数据库。
③MapReduce:一种编程模型,主要思想:概念“Map(映射)”和“Reduce(归约)”。
④Chukwa:用于监控大型分布式系统的数据收集系统。
数据仓库:数据仓库是一个面向主题的、集成的、非易失的、且随时间变化的数据集合,用于支持管理决策;
数据挖掘:数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。
标签:知识点,项目管理,数据库,系统集成,2022,数据挖掘,数据 来源: https://blog.csdn.net/weixin_46619295/article/details/122861093
本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享; 2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关; 3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关; 4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除; 5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。