解决huggingface中模型无法自动下载或者下载过慢的问题

项目场景：调用hugging face公开模型数据集中的transformers模型。问题描述默认源在国内下载模型过慢，甚至不开始下载。原因分析：部分博客解决方案为：在from_pretrained中添加参数mirror="tuna" 将下载源替换为清华源。tokenizer = BertTokenizer.from_pretrained("bert-base-uncased", mirror="

COHREZ

31901人浏览 · 2022-04-01 22:34:50

COHREZ · 2022-04-01 22:34:50 发布

项目场景：

调用hugging face公开模型数据集中的transformers模型。

问题描述：

默认源在国内下载模型过慢，甚至不开始下载。

原因分析：

部分博客解决方案为：
在from_pretrained中添加参数mirror="tuna" 将下载源替换为清华源。

tokenizer = BertTokenizer.from_pretrained("bert-base-uncased", mirror="tuna")

然而，清华源现在不支持hugging face的下载（2021.8月之后）。
因此，无论在conda替换源还是在代码中指定源为清华源都无效。

解决方案：

参考 https://blog.csdn.net/weixin_43646592/article/details/119520963

在hugging face官网上手动下载模型文件，而后上传到服务器上。具体如下：

1 搜索模型

在这里插入图片描述

2 下载文件

注意：一定要下载全，包括适用于框架的模型（tf为h5，pytorch为bin）、词表、模型配置文件、tokenizer配置文件、一些看起来无关紧要的txt文件。
无关紧要的txt文件一定不要忘记下载。

3 将上述下载的文件放在统一的文件夹中，命名为模型名，（例如：xlm-mlm-100-1280），上传至运行代码同一目录下。
4 继续使用代码调用

tokenizer = XLMTokenizer.from_pretrained("xlm-mlm-100-1280")

华为开发者空间

华为开发者空间，是为全球开发者打造的专属开发空间，汇聚了华为优质开发资源及工具，致力于让每一位开发者拥有一台云主机，基于华为根生态开发、创新。

更多推荐

cover

昇腾CANN算子共建仓CANN-Ops正式上线Gitee，首批算子已合入

华为开发者空间

cover

在应用内购票、寄件时，如何一键填充所需信息？

华为开发者空间

cover

HCDG城市行·阜阳站——AIGC大师班走进阜阳，技术赋能广电媒体，推动行业创新升级

华为开发者空间

所有评论(0)

COHREZ

已为社区贡献1条内容

热门标签

免费领云主机

域名注册服务

弹性云服务器

运营活动

活动日历查看更多

直播时间 2025-02-26 16:00:00

华为云 x DeepSeek：AI驱动云上应用创新

华为云开发者联盟

直播时间 2025-01-08 16:30:00

DTT年度收官盛典：华为开发者空间大咖汇，共探云端开发创新

华为云开发者联盟

直播时间 2024-12-11 16:30:00

华为云数字人，助力行业数字化业务创新

华为云开发者联盟

直播时间 2024-11-27 16:30:00

企业数据治理一站式解决方案及应用实践

华为云开发者联盟

直播时间 2024-11-21 16:30:00

轻松构建AIoT智能场景应用

华为云开发者联盟

相关产品

华为云主机专属于您的在线开发环境云主机华为云云主机 2核4G云主机免费领免费领华为云主机