(1)数据的维度是数据的组织形式。
根据数据的关系不同,数据组织可以分为:一维数据、二维数据,多维数据和高维数据:
一维数据采用线性方式组织,对应于数学中数组的概念
二维数据,也称表格数据,采用二维表格方式组织,它包括列表,对应于数学中的矩阵,
多维数据由一维或二维数据在新维度上扩展形式,比如说加上时间维度。
高维数据由键值对类型的数据构成,采用对象方式组织,可以多层嵌套。
(2)Python中数据的维度
一维数据:列表和集合类型
二维或多维数据:列表
高维数据:字典、JSON、XML、YAML
(3)一维数据的处理
A. 一维数据是最简单的数据组织类型,由于是线性结构,在Python语言中主要采用列表形式表示。
B. 一维数据的文件存储:一维数据的文件存储有多种方式,总体思路是采用特殊字符分隔各数据。常用存储方法包括如下四种:
分隔符 例子
采用空格分隔元素 北京 上海 天津 重庆
采用逗号分隔元素 北京,上海,天津,重庆
采用换行分隔元素
采用其他特殊符号元素 北京;上海;天津;重庆
这4种方法中,逗号分隔的存储格式叫作CSV格式,即逗号分隔值。存储的文件一般采用**.csv**为扩展名。英文逗号!
大部分编辑器都支持直接读入或保存文件为CSV格式
一维数据保存成CSV格式后,各元素采用逗号分隔,形成一行。从Python表示到数据存储,需要将列表对象输出为CSV格式以及将CSV格式读入成列表对象
C. 对一维数据进行处理
=> 将CSV格式读入成列表对象
首先需要从CSV格式文件读入一维数据,并将其表示为列表对象。
需要注意,最后一个元素后面有一个换行符(“\n”)。需要采用字符串的strip()方法去掉尾部的换行符,进一步使用split()方法以逗号进行分割。