P48思考与练习3

1.创建50×7的DataFrame对象,数据为 [10,99]之间的随机整数;columns为字符a-g;将DataFrame对象保存到csv文件中。

【提示】使用NumPy的随机生成函数randint()生成数据。

#第1题
import numpy as np
from pandas import DataFrame
df = DataFrame(np.random.randint(10,100,size = (50,7)),columns = ['a','b','c','d','e','f','g'])
df.to_csv('1.csv',mode = 'w',header = True,index = False)

2.  海伦一直使用在线交友网站寻找适合的约会对象, 她将交友数据存放在datingTestSet.xls文件中。

1)从文件中读取有效数据保存到Dataframe对象中,跳过所有文字解释行;

2)列索引名设为 ['flymiles','videogame','icecream','type’];

3)显示读取到的前面5条数据;

4)显示所有'type'为'largeDoses‘的数据;

本书中所有的数据文件保存在data文件夹中,链接如下:

https://pan.baidu.com/s/1Tu__B-YfXDz_yXzbzNKB4A?pwd=sfw2 
提取码:sfw2

#第二题
import pandas as pd
#1,2)
frienddata = pd.read_csv('data\datingTestSet.csv',header = None,names = ['flymiles','videogame','icecream','type'],
                         skiprows = 2)                   #此处为names定义列索引
#3)
print(frienddata[:5])
#4)
print(frienddata[frienddata['type'] =='largeDoses'])     #或者frienddata.loc[frienddata['type'] =='largeDoses',: ]
Logo

为开发者提供学习成长、分享交流、生态实践、资源工具等服务,帮助开发者快速成长。

更多推荐