NLTK安装教程

本文介绍NLTK包和NLTK data的安装教程

诸神缄默不语

8772人浏览 · 2022-05-30 12:16:28

诸神缄默不语 · 2022-05-30 12:16:28 发布

诸神缄默不语-个人CSDN博文目录

NLTK是自然语言处理中常用的Python包，本文介绍NLTK包的安装方式，以及在这一安装过程中常见的坑。
NLTK官网：NLTK :: Natural Language Toolkit

NLTK的安装分为Python包的安装和NLTK data的安装，以下会分别对其进行介绍。

文章目录

1. NLTK包安装
2. NLTK data的安装

1. NLTK包安装

官网安装教程：NLTK :: Installing NLTK
NLTK仅支持3.7, 3.8, 3.9, 3.10版本的Python。
我是用Linux服务器运行，因此参考Unix系统的安装教程。但是需要注意的是，官网上直接给出的命令行是：pip install --user -U nltk 建议去掉--user参数，原因如下：

直接使用这个命令可以正确安装NLTK包，但是根据 -user 参数，会安装到用户文件夹下：
在这里插入图片描述
就像这个警告信息所显示的那样，我的这个本地路径不在系统路径下，所以这个的问题在于，使用VSCode的话，终端是可以正确调用的：

但是在VSCode编辑器直接打开的jupyer notebook文件中就无法直接调用。我怀疑是因为jupyter notebook文件的工作路径就是对应文件，因此找不到这个包。
所以我的做法是我在jupyter notebook里面pip install nltk（如果在终端这么干还是会导致包下载在.local/下）：
在这里插入图片描述
这样就可以正常import nltk了。
可以看出直接用这个命令，就会安装到包路径下：

2. NLTK data的安装

官网安装教程：NLTK :: Installing NLTK Data

当代码中出现需要用到指定data，但是对应的Python虚拟环境中没有相应data的时候，就会自动提示运行代码来安装，以stopwords为例，当代码中出现from nltk.corpus import stopwords但是没有下载时，就会自动提示运行如下代码：

import nltk
nltk.download('stopwords')

输出：

[nltk_data] Downloading package stopwords to
[nltk_data]     /home/user_name/nltk_data...
[nltk_data]   Unzipping corpora/stopwords.zip.
True

即为安装成功，下次执行from nltk.corpus import stopwords就能执行成功了。

华为开发者空间

华为开发者空间，是为全球开发者打造的专属开发空间，汇聚了华为优质开发资源及工具，致力于让每一位开发者拥有一台云主机，基于华为根生态开发、创新。

更多推荐

2025 CCF中国软件大会（CCF ChinaSoft）智能化研发智能体技术论坛成功召开

华为开发者空间

版本速递 | 华为云Versatile智能体平台新增特性介绍（2025年11月发布）

应用管理支持单智能体应用、工作流应用发布为网页，可分享使用；并增加资源配置业务价值：通过一键发布，支持在web端快捷访问智能体应用；可通过链接形式将Agent分享给他人体验，极大提升AI Agent的对外分享能力与成果使用率。

华为开发者空间

基于华为开发者空间，Astro+MaaS实现高考志愿择校推荐系统

华为开发者空间

所有评论(0)

查看更多评论

诸神缄默不语

@PolarisRisingWar

已为社区贡献10条内容