python读取文件的指定行,可以使用以下的方法

1、os.mknod(“test.txt”) #创建空文件

2、fp = open(“test.txt”,w) #直接打开一个文件,如果文件不存在则创建文件

3、open 模式

处理文件时,一个常见的需求就是读取文件的指定行内容,那么该如何实现的?

with open('a.log', 'r') as fp:

    lines = fp.readlines()

    last_line = lines[-1]

即使不考虑异常处理的问题,这个代码也不完美,因为如果文件很大,lines = fp.readlines()会造成很大的时间和空间开销。

解决的思路是用将文件指针定位到文件尾,然后从文件尾试探出一行的长度,从而读取最后一行。代码如下:

def __get_last_line(self, filename):

    """

    get last line of a file

    :param filename: file name

    :return: last line or None for empty file

    """

    try:

        filesize = os.path.getsize(filename)

        if filesize == 0:

            return None

        else:

            with open(filename, 'rb') as fp: # to use seek from end, must use mode 'rb'

                offset = -8                 # initialize offset

                while -offset < filesize:   # offset cannot exceed file size

                    fp.seek(offset, 2) #read#offset chars from eof(represent by number'2')

                    lines = fp.readlines()  # read from fp to eof

                    if len(lines) >= 2:     # if contains at least 2 lines

                        return lines[-1]    # then last line is totally included

                    else:

                        offset *= 2         # enlarge offset

                fp.seek(0)

                lines = fp.readlines()

                return lines[-1]

    except FileNotFoundError:

        print(filename + ' not found!')

        return None

其中有几个注意点:

  1. fp.seek(offset[, where])中where=0,1,2分别表示从文件头,当前指针位置,文件尾偏移,缺省值为0,但是如果要指定where=2,文件打开的方式必须是二进制打开,即使用’rb’模式,

  2. 设置偏移量时注意不要超过文件总的字节数,否则会报OSError,

  3. 注意边界条件的处理,比如文件只有一行的情况。

fp.read([size]) #size为读取的长度,以byte为单位

fp.readline([size]) #读一行,如果定义了size,有可能返回的只是一行的一部分

fp.readlines([size])
#把文件每一行作为一个list的一个成员,并返回这个list。其实它的内部是通过循环调用readline()来实现的。如果提供size参数,size是表示读取内容的总长,也就是说可能只读到文件的一部分。

fp.write(str) #把str写到文件中,write()并不会在str后加上一个换行符

fp.writelines(seq)
#把seq的内容全部写到文件中(多行一次性写入)。这个函数也只是忠实地写入,不会在每行后面加上任何东西。

fp.close() #关闭文件。python会在一个文件不用后自动关闭文件,不过这一功能没有保证,最好还是养成自己关闭的习惯。
如果一个文件在关闭后还对其进行操作会产生ValueError

fp.flush() #把缓冲区的内容写入硬盘

fp.fileno() #返回一个长整型的”文件标签“

fp.isatty() #文件是否是一个终端设备文件(unix系统中的)

fp.tell() #返回文件操作标记的当前位置,以文件的开头为原点

fp.next() #返回下一行,并将文件操作标记位移到下一行。把一个file用于for … in
file这样的语句时,就是调用next()函数来实现遍历的。

fp.seek(offset[,whence])
#将文件打操作标记移到offset的位置。这个offset一般是相对于文件的开头来计算的,一般为正数。但如果提供了whence参数就不一定了,whence可以为0表示从头开始计算,1表示以当前位置为原点计算。2表示以文件末尾为原点进行计算。需要注意,如果文件以a或a+的模式打开,每次进行写操作时,文件操作标记会自动返回到文件末尾。

fp.truncate([size])
#把文件裁成规定的大小,默认的是裁到当前文件操作标记的位置。如果size比文件的大小还要大,依据系统的不同可能是不改变文件,也可能是用0把文件补到相应的大小,也可能是以一些随机的内容加上去。
原文:https://www.py.cn/faq/python/12844.html

Logo

为开发者提供学习成长、分享交流、生态实践、资源工具等服务,帮助开发者快速成长。

更多推荐