一、什么是数据规范化
数据规范化是指将不规范的数据转换成符合标准的数据,使其具有更好的可读性和可用性。不规范的数据包括数据格式不统一、数据类型不一致、数据缺失或错误等等。数据规范化可以通过一系列的处理步骤来实现,包括数据清洗、数据转换、数据合并等等。
dase和Series两种数据结构,可以方便地进行数据清洗、转换、合并等操作。
dasa方法删除缺失值
portdas as pd
data = pd.read_csv(‘data.csv’)a()
Py中用于科学计算的库,它提供了高效的数组操作和数学函数,可以方便地进行数据转换和计算。
Py库中的astype方法将数据类型转换为指定类型
portumpyp
p.array([1, 2, 3, 4, 5])
data = data.astype(float)
(正则表达式)
正则表达式是一种用于匹配字符串的模式,可以方便地进行字符串操作和匹配。
例如,大家可以使用正则表达式匹配特定格式的字符串,并进行替换和清洗
port re
data = ‘2019-01-01’
data = re.sub(‘-‘, ”, data)
dasPy库和方法,希望对读者有所帮助。