【小白从小学Python、C、Java】

【Python全国计算机等级考试】

【Python数据分析考试必会题】

● 标题与摘要

Python数据分析中的

数据预处理:数据标准化

● 选择题

以下关于数据标准化说法错误的是:

A 将数据按比例缩放,使之落入一个小的特定区间

B Min-max标准化是数据标准化的方法

C Z-score标准化是数据标准化的方法

D Min-max标准化后结果落到[-1,1]区间

​● 问题解析

1.数据标准化是什么:在数据分析之前,我们通常需要先将数据标准化,利用标准化后的数据进行数据分析。数据的标准化是将数据按比例缩放,使之落入一个小的特定区间。常用的方法有Min-max标准化,Z-score标准化。A,B,C正确

2.数据标准化的作用:数据标准化处理主要包括数据同趋化处理和无量纲化处理两个方面。数据同趋化处理主要解决不同性质(正指标和逆指标)的数据问题,对不同性质指标直接加总不能正确反映不同指标带来的综合结果,须先考虑改变逆指标数据性质,使所有指标对测评方案的作用力同趋化,再加总才能得出正确结果。数据无量纲化处理主要解决数据的可比性。

3.Min-max标准化是最基本的一种数据标准化方法,指的是将数据压缩到[0,1]之间。标准化的公式为:新数据=(原数据-最小值)/(最大值-最小值)。(说明:最小值,最大值为原数据的最小值,最大值)。D错误

4.Z-score标准化基于原始数据的均值(mean)和标准差(standard deviation)进行数据的标准化。标准化的公式为:新数据=(原数据-均值)/标准差。(说明:均值,标准差为原数据的均值,标准差)。

​● 附图 

图1 用python实现两种标准化方法——写数据标准化的函数

图2 原数据展示

图3 用python实现两种标准化方法——对数据进行标准化

● 附图代码

import pandas as pd

import numpy as np

#Min-max标准化

def MaxMinNormalization(x):

"""[0,1] normaliaztion"""

x = (x - np.min(x)) / (np.max(x) - np.min(x))

return x

#Z-score标准化

def ZscoreNormalization(x):

"""Z-score normaliaztion"""

x = (x - np.mean(x)) / np.std(x)

return x

data = {'Site':[6,3,8,9,1],

'Age':[32,12,56,28,34],

'Pre':[-1.41,0.3,0.81,-0.04,0.54]}

data1 = pd.DataFrame(data)

print (data1)

#Min-max标准化

print(MaxMinNormalization(data1))

#Z-score标准化

print(ZscoreNormalization(data1))

● 正确答案

D

欢迎大家转发,一起传播知识和正能量,帮助到更多人。期待大家提出宝贵改进建议,互相交流,收获更大。辛苦大家转发时注明出处(也是咱们公益编程交流群的入口网址),刘经纬老师共享知识相关文件下载地址为:http://liujingwei.cn

Logo

华为开发者空间,是为全球开发者打造的专属开发空间,汇聚了华为优质开发资源及工具,致力于让每一位开发者拥有一台云主机,基于华为根生态开发、创新。

更多推荐