一、问题

在使用numpy进行excel表的数据加载中,经常会遇到如下问题

Traceback (most recent call last):
  File "D:/ProgramData/GAN_NIRs/Preprocessing/Data_Load.py", line 45, in <module>
    data4 = np.loadtxt(open(data_path4, 'rb'), dtype=np.float64, delimiter=',', skiprows=0)
  File "D:\Anaconda\envs\Pytorch16\lib\site-packages\numpy\lib\npyio.py", line 1139, in loadtxt
    for x in read_data(_loadtxt_chunksize):
  File "D:\Anaconda\envs\Pytorch16\lib\site-packages\numpy\lib\npyio.py", line 1067, in read_data
    items = [conv(val) for (conv, val) in zip(converters, vals)]
  File "D:\Anaconda\envs\Pytorch16\lib\site-packages\numpy\lib\npyio.py", line 1067, in <listcomp>
    items = [conv(val) for (conv, val) in zip(converters, vals)]
  File "D:\Anaconda\envs\Pytorch16\lib\site-packages\numpy\lib\npyio.py", line 763, in floatconv
    return float(x)
ValueError: could not convert string to float: ''

这里都可能由两种原因引起的,第一种,是因为excel中保存的格式存在问题,第二种是因为excel表中的含有string,无法将字符转换成float的类型

二、解决办法

第一种解决办法,如果,代码直接加载且excel表中没有字符

data = np.loadtxt(open(path, 'rb')

可以考虑改成如下

data = np.loadtxt(open(path, 'rb'), dtype=np.float64, delimiter=',', skiprows=0)

第二种,由于excel表中存在字符而读取错误,建议使用pandas进行读取

二、使用步骤

1.引入库

代码如下(示例):

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import warnings
warnings.filterwarnings('ignore')
import  ssl
ssl._create_default_https_context = ssl._create_unverified_context

2.读入数据

代码如下(示例):

data = pd.read_csv(
    'https://labfile.oss.aliyuncs.com/courses/1283/adult.data.csv')
print(data.head())

该处使用的url网络请求的数据。


总结

提示:这里对文章进行总结:
例如:以上就是今天要讲的内容,本文仅仅简单介绍了pandas的使用,而pandas提供了大量能使我们快速便捷地处理数据的函数和方法。

Logo

为开发者提供学习成长、分享交流、生态实践、资源工具等服务,帮助开发者快速成长。

更多推荐