ICode9

精准搜索请尝试: 精确搜索
首页 > 其他分享> 文章详细

数据的结构化、半结构化、非结构化

2021-07-04 23:35:19  阅读:145  来源: 互联网

标签:文件 结构化 数据库 数据 数据模型 属性


结构化数据

  结构化数据指的可以在一个记录文件里面以固定格式存在的数据,它依赖于提前建立好的数据标准规范(有时候也称元数据),例如:需要多少个属性,每个属性什么类型,每个属性的取值范围等等,类似下图所示,提前定义好了一个二维矩阵的元数据,包含有列名称、列的类型、列的约束等:

  

   可见,虽然结构化数据的存储和排列是很有规律的,这对查询和修改等操作很有帮助。但是,它的扩展性不好(比如,业务需要增加一个字段,此时就需要将已存储入库的所有数据全部更新一遍,效率极低)。

 

非结构化数据

  非结构化数据是指信息无法预先定义其格式规范的数据模型。非结构化数据一般指文字型数据但同时数据中又存在很多诸如时间、数字等的信息。相对于传统的在数据库中或者标记好的文件,由于他们的非特征性和歧义性会更难理解。包括所有格式的办公文Word、PPT、文本、图片、各类报表、图像和音频/视频信息等等。

  对非结构化的数据,我们一般以二进制的形式直接整体进行存储

 

半结构化数据

  半结构化数据就是介于完全结构化数据(如关系型数据库、面向对象数据库中的数据)和完全非结构的数据(如声音、图像文件等)之间的数据,它并无明确的数据模型结构,但包含相关标记定义可用来分隔语义元素以及对记录和字段进行分层。因此,它也被称为自描述的结构。

  半结构化数据,属于同一类的实体可以有不同的属性,即使他们被组合在一起,且这些属性的顺序也并不重要。例如,日志文件、HTML文件、XML文档、JSON文档、Email等。

  现以常见的XML文件举例如下(属性的顺序可以调整,且属性的个数是可以不一样):

          

  可见,半结构化的数据格式可以自由地表达、更新很多有用的信息。所以,半结构化数据的扩展性是很好的

标签:文件,结构化,数据库,数据,数据模型,属性
来源: https://www.cnblogs.com/lucky815/p/14970358.html

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有