Python数据分析中的数据预处理:数据标准化
【小白从小学Python、C、Java】【Python全国计算机等级考试】【Python数据分析考试必会题】● 标题与摘要Python数据分析中的数据预处理:数据标准化● 选择题以下关于数据标准化说法错误的是:A 将数据按比例缩放,使之落入一个小的特定区间B Min-max标准化是数据标准化的方法C Z-score标准化是数据标准化的方法D Min-max标准化后结果落到[-1,1]区间● 问
【小白从小学Python、C、Java】
【Python全国计算机等级考试】
【Python数据分析考试必会题】
● 标题与摘要
Python数据分析中的
数据预处理:数据标准化
● 选择题
以下关于数据标准化说法错误的是:
A 将数据按比例缩放,使之落入一个小的特定区间
B Min-max标准化是数据标准化的方法
C Z-score标准化是数据标准化的方法
D Min-max标准化后结果落到[-1,1]区间
● 问题解析
1.数据标准化是什么:在数据分析之前,我们通常需要先将数据标准化,利用标准化后的数据进行数据分析。数据的标准化是将数据按比例缩放,使之落入一个小的特定区间。常用的方法有Min-max标准化,Z-score标准化。A,B,C正确
2.数据标准化的作用:数据标准化处理主要包括数据同趋化处理和无量纲化处理两个方面。数据同趋化处理主要解决不同性质(正指标和逆指标)的数据问题,对不同性质指标直接加总不能正确反映不同指标带来的综合结果,须先考虑改变逆指标数据性质,使所有指标对测评方案的作用力同趋化,再加总才能得出正确结果。数据无量纲化处理主要解决数据的可比性。
3.Min-max标准化是最基本的一种数据标准化方法,指的是将数据压缩到[0,1]之间。标准化的公式为:新数据=(原数据-最小值)/(最大值-最小值)。(说明:最小值,最大值为原数据的最小值,最大值)。D错误
4.Z-score标准化基于原始数据的均值(mean)和标准差(standard deviation)进行数据的标准化。标准化的公式为:新数据=(原数据-均值)/标准差。(说明:均值,标准差为原数据的均值,标准差)。
● 附图
图1 用python实现两种标准化方法——写数据标准化的函数
图2 原数据展示
图3 用python实现两种标准化方法——对数据进行标准化
● 附图代码
import pandas as pd
import numpy as np
#Min-max标准化
def MaxMinNormalization(x):
"""[0,1] normaliaztion"""
x = (x - np.min(x)) / (np.max(x) - np.min(x))
return x
#Z-score标准化
def ZscoreNormalization(x):
"""Z-score normaliaztion"""
x = (x - np.mean(x)) / np.std(x)
return x
data = {'Site':[6,3,8,9,1],
'Age':[32,12,56,28,34],
'Pre':[-1.41,0.3,0.81,-0.04,0.54]}
data1 = pd.DataFrame(data)
print (data1)
#Min-max标准化
print(MaxMinNormalization(data1))
#Z-score标准化
print(ZscoreNormalization(data1))
● 正确答案
D
欢迎大家转发,一起传播知识和正能量,帮助到更多人。期待大家提出宝贵改进建议,互相交流,收获更大。辛苦大家转发时注明出处(也是咱们公益编程交流群的入口网址),刘经纬老师共享知识相关文件下载地址为:http://liujingwei.cn
更多推荐
所有评论(0)