1、es库连接

from elasticsearch import Elasticsearch
es = Elasticsearch(["x.x.x.x: 9200"])

2、将文档(txt、word、excel)内容存入到es库

存储思路:不同类型的文档设置不同的额索引名称,从es库中查询文档时相对比较方便,将文件名称、文件内容处理成字符串存入到es库

文件内容读取方式:

word文档使用 Document() 方法;txt文档使用open()方法;excel使用 xlrd.open_workbook()方法

3、根据关键字从es库获取到相关文档

将关键字参数放在es.search()方法中即可查询到在哪些文档中出现过该关键字

es.search(index="XX", doc_type="XX", body={"query": {"match": {"word_info": "关键字参数"}}}, filter_path=['hits.hits._source'])

如有不同理解,还请指教。

Logo

华为开发者空间,是为全球开发者打造的专属开发空间,汇聚了华为优质开发资源及工具,致力于让每一位开发者拥有一台云主机,基于华为根生态开发、创新。

更多推荐