python读取(parq)parquet文件
由于pandas库改了,没有read_parq这个函数了所以parq读取的方法变成了:(1)用conda或者pip安装pyarrow包pip install pyarrow(2)导入pyarrow包import pyarrow as paimport pyarrow.parquet as pq(3)读取df = pq.read_table(u'parq文件的路径').to_pandas()最后df
·
由于pandas库改了,没有read_parq这个函数了
所以parq读取的方法变成了:
(1)用conda或者pip安装pyarrow包
pip install pyarrow
(2)导入pyarrow包
import pyarrow as pa
import pyarrow.parquet as pq
(3)读取
df = pq.read_table(u'parq文件的路径').to_pandas()
最后df就是以前pandas情况下读到的parq文件(DataFrame格式)
更多推荐
所有评论(0)