由于pandas库改了,没有read_parq这个函数了
所以parq读取的方法变成了:
(1)用conda或者pip安装pyarrow包

pip install pyarrow

(2)导入pyarrow包

import pyarrow as pa
import pyarrow.parquet as pq

(3)读取

df = pq.read_table(u'parq文件的路径').to_pandas()

最后df就是以前pandas情况下读到的parq文件(DataFrame格式)

Logo

为开发者提供学习成长、分享交流、生态实践、资源工具等服务,帮助开发者快速成长。

更多推荐