Pytorch中的Dataloader返回哪些东西？

开飞机的小毛驴儿 · 2021-01-28 10:05:34 发布

Pytorch的数据读取主要包括3个类：

1.Dataset

2.DataLoader

3.DataLoaderIter

这三者的大致是依次封装的关系，1被装进2，2被装进3

一.torch.utils.data.Dataset是一个抽象类，自定义的Dataset需要集成它并实现两个成员方法：

1.__getitem__()

2.__len__()

第一个最为重要，即每次怎么读数据。以图片为例：

def __getitem__(self,index):
    img_path,label=self.data[index].img_path,self.data[index].label
    img=Image.open(img_path)
    return img,label

因为Dataset被封进Dataloader，从这里基本上就知道dataloader返回哪些东西了。如果需要看dataloader的东西，大致可以采用以下几行代码简单看一下dataloader里面的东西：

for inputs,label in dataloader:
    print(inputs,labels)

也就是说，默认情况下遍历dataloader其实就是输出一个batch内的图像和对应的label

华为开发者空间，是为全球开发者打造的专属开发空间，汇聚了华为优质开发资源及工具，致力于让每一位开发者拥有一台云主机，基于华为根生态开发、创新。

更多推荐

如何在鲲鹏平台上快速上手应用开发？鲲鹏DevKit给你答案

鲲鹏DevKit针对不同的业务场景，提供了应用迁移和系统迁移两套解决方案，帮忙开发者快速从X86平台迁移至鲲鹏平台，通过详细的迁移建议降低迁移门槛，可视化展示迁移进度，打消鲲鹏平台开发的顾虑。

AI大模型高效开发神器来了，解读ModelArts 8大能力

华为云开源项目Sermant正式成为CNCF官方项目

查看更多评论

已为社区贡献1条内容