value_counts() 方法返回一个序列 Series,该序列包含每个值的数量。也就是说,对于数据框中的任何列,value-counts () 方法会返回该列每个项的计数。

value_counts()是Series拥有的方法,一般在DataFrame中使用时,需要指定对哪一列或行使用。value_Coutn只能对应series,不能直接对整个dataframe做操作

value_counts()在DataFrame的用法:

import pandas as pd
import numpy as np
df1= DataFrame(
                {"handsome":["timo","anni","timo"],
                "smart":["mike","anni","mike"]}
                )
print(df1)
'''
  handsome smart
0     timo  mike
1     anni  anni
2     timo  mike
'''

df1.apply(pd.value_counts)##数据框要借助apply来应用value_counts()
'''
	   handsome	smart
anni	1.0	     1.0
mike	NaN	     2.0
timo	2.0	     NaN
'''

 

value_counts()  把每個值分別有多少展示一下.在 python 当中 除了 0 其他數字都是 true。所以在这里,括号里可以用任何数字表示。

churn.flag.value_counts()
0 5174
1 1869
Name: flag, dtype: int64

churn.flag.value_counts(normalize=True)
0 0.73463
1 0.26537
Name: flag, dtype: float64

churn.flag.value_counts(1)
0 0.73463
1 0.26537
Name: flag, dtype: float64

 

value_counts()是一种查看表格某列中有多少个不同值的快捷方法,并计算每个不同值有在该列中有多少重复值。


import pandas as pd
import numpy as np
from pandas import DataFrame
from pandas import Series
s1=Series(["timo","mike","anni","timo"])
s1.value_counts()
'''
timo    2
mike    1
anni    1
dtype: int64
'''

 

pandas 计数函数value_counts()

value_counts(normalize=False, sort=True, ascending=False, bins=None, dropna=True)
'''
normalize : boolean, default False 默认false,如为true,则以百分比的形式显示
sort : boolean, default True 默认为true,会对结果进行排序
ascending : boolean, default False 默认降序排序
bins : integer, 格式(bins=1),意义不是执行计算,而是把它们分成半开放的数据集合,只适用于数字数据
dropna : boolean, default True 默认删除na值
'''

value_counts()并不是未带任何参数,而是所有参数都是默认的


 

Logo

华为开发者空间,是为全球开发者打造的专属开发空间,汇聚了华为优质开发资源及工具,致力于让每一位开发者拥有一台云主机,基于华为根生态开发、创新。

更多推荐