结构化数据,简单来说就是数据库。 相对于结构化数据(即行数据,存储在数据库里,可以用二维表结构来逻辑表达实现的数据)而言,不方便用数据库二维逻辑表来表现的数据即称为非结构化数据。
因为数据仓库中的数据是面向某一主题的数据的集合,这些数据从多个业务系统中抽取而来而且包含历史数据,这样就避免不了有的数据是错误数据、有的数据相互之间有冲突,这些错误的或有冲突的数据显然是大家不想要的,称为“脏数据”。
大家要按照一定的规则把“脏数据”“洗掉”,这就是数据清洗。 结构化数据即行数据,存储在数据库里,可以用二维表结构来逻辑表达实现的数据。
非结构化数据,包括所有格式的办公文档、文本、图片、XML、HTML、各类报表、图像和音频/视频信息等等。 所谓半结构化数据,就是介于完全结构化数据(如关系型数据库、面向对象数据库中的数据)和完全无结构的数据(如声音、图像文件等)之间的数据,HTML文档就属于半结构化数据。它一般是自描述的,数据的结构和内容混在一起,没有明显的区分。
禁止浏览器翻译css,css中找盒子,gulp css压缩插件,css 如何设置表格tr,js css美化滚动条,css文字居右怎么设置,jis和css