Python读取csv文件的某一行

站长用Python写了一个可以提取csv任一列的代码,欢迎使用。Github链接

csv是Comma-Separated Values的缩写,是用文本文件形式储存的表格数据,比如如下的表格,就可以存储为csv文件,文件内容是:

No.,Name,Age,Score
1,Apple,12,98
2,Ben,13,97
3,Celia,14,96
4,Dave,15,95

假设上述csv文件保存为"A.csv",如何用Python像操作Excel一样提取其中的一行,也就是一条记录,利用Python自带的csv模块,有两种方法可以实现。

reader函数

第一种方法使用reader函数,接收一个可迭代的对象(比如csv文件),能返回一个生成器,就可以从其中解析出csv的内容,比如下面的代码可以读取csv的全部内容,以行为单位:

import csv

with open('A.csv','rb') as csvfile:
    reader = csv.reader(csvfile)
    rows = [row for row in reader]
    
print rows

得到:

[['No.', 'Name', 'Age', 'Score'],
['1', 'Apple', '12', '98'],
['2', 'Ben', '13', '97'],
['3', 'Celia', '14', '96'],
['4', 'Dave', '15', '95']]

如果只要提取其中第三行,可以用下面的代码:

import csv

with open(‘A.csv’,‘rb’) as csvfile:
    reader = csv.reader(csvfile)
    for i,rows in enumerate(reader):
        if i == 2:
            row = rows
            
print row 

得到:

[2, ‘Ben’,13,97]

这种方法是通用的方法,要事先知道行号,比如Ben的记录在第3行,而不能根据’Ben’这个名字查询。

DictReader

这时可以采用第二种方法:
第二种方法是使用DictReader,和reader函数类似,接收一个可迭代的对象,能返回一个生成器,但是返回的每一个单元格都放在一个字典的值内,而这个字典的键则是这个单元格的标题(即列头)。用下面的代码可以看到DictReader的结构:

import csv

with open(‘A.csv’,‘rb’) as csvfile:
    reader = csv.DictReader(csvfile)
    rows = [row for row in reader]
    
print rows

得到:

[{‘Age’:12, ‘No.:1, ‘Score’:98, ‘Name’: ‘Apple’},
{‘Age’:13, ‘No.:2, ‘Score’:97, ‘Name’: ‘Ben’},
{‘Age’:14, ‘No.:3, ‘Score’:96, ‘Name’: ‘Celia’},
{‘Age’:15, ‘No.:4, ‘Score’:95, ‘Name’: ‘Dave’}]

如果我们想用DictReader读取csv的某一列,就可以用列的标题查询:

import csv

with open(‘A.csv’,‘rb’) as csvfile:
    reader = csv.DictReader(csvfile)
    for row in reader:
        if row[‘Name’]==‘Ben’:
            print row

就得到:

{‘Age’:13, ‘No.:2, ‘Score’:97, ‘Name’: ‘Ben’}

可见,DictReader很适合读取csv的的行(记录)。

Logo

华为开发者空间,是为全球开发者打造的专属开发空间,汇聚了华为优质开发资源及工具,致力于让每一位开发者拥有一台云主机,基于华为根生态开发、创新。

更多推荐