ES增删改查入门

使用restful操作es客户端

Zhao_Jie_

1625人浏览 · 2022-03-17 09:49:19

Zhao_Jie_ · 2022-03-17 09:49:19 发布

一、文档管理
1、添加文档
向索引中添加一行数据。
使用json来表示。
使用restful形式的api来实现。
put：添加
post：修改
delete：删除

方法：
	put
url：
	http://192.168.68.129:9200/{索引}/_doc/{_id}
	文档的id（_id）推荐和真正数据的id保持一致。
请求体：
	尽量和mapping设置的文档格式保持一致。
	{
		"id":1,
		"title":"这是一篇文章",
		"content":"xxxxx",
		"comment":"备注信息",
		"mobile":"13344556677"
	}

2、修改文档

方法：
		POST
	url：
		http://192.168.68.129:9200/{索引}/_doc/{_id}
	请求体：
		{
			"id":1,
			"title":"这是一篇文章",
			"content":"xxxxx",
			"comment":"备注信息",
			"mobile":"13344556677"
		}
	修改的原理是，先删除后添加

3、删除文档

	方法：
		DELETE
	ulr:
		http://192.168.68.129:9200/{索引}/_doc/{_id}

4、根据_id取文档

	方法：
		GET
	url：
		http://192.168.68.129:9200/{索引}/_doc/{_id}

5、使用批处理_bulk

方法：
		PUT、POST
	url：
		http://192.168.68.129:9200/{索引}/_bulk
	请求体：
		{action:{metadata}}
		{请求体数据信息json格式}
		{action:{metadata}}
		{请求体数据信息json格式}
		{action:{metadata}}
		{请求体数据信息json格式}
		{action:{metadata}}
		{请求体数据信息json格式}
		最后需要有一个换行
	例如：
		请求方法：
			POST
		url：
			http://192.168.68.129:9200/blog/_bulk
		请求体：
			action对应的取值：
				create：创建一个文档，如果文档不存在就创建。
				index：创建一个新的文档，如果文档存在就更新。
				update：批量更新文档
				delete：批量删除，不需要有请求体。
			元数据：
				_index:要写入的索引信息
				_type:要写入的type
				_id:要写入文档的id
			{"index":{"_id":1}}
			{"id":1, "title":"这是一篇文章", "content":"xxxxx", "comment":"备注信息", "mobile":"13344556677"}
			{"index":{"_id":2}}
			{"id":2, "title":"这是一篇文章", "content":"xxxxx", "comment":"备注信息", "mobile":"13344556677"}
			{"index":{"_id":3}}
			{"id":3, "title":"这是一篇文章", "content":"xxxxx", "comment":"备注信息", "mobile":"13344556677"}

二、查询数据

1、查询的语法

	方法：
		POST
	url：
		http://192.168.68.129:9200[/{blog}][/{type}]/_search
	请求体：
		json形式的查询语句
		{
			"query":{
				"xxxx"
			}
		}

2、查询全部数据 match_all查询

	{
		"query":{
			"match_all":{}
		}
	}

3、termQuery 关键词查询
是所有查询中最级基本的一个查询。
根据关键词进行查询，如果关键词在索引中存在那么就有结果，
如果关键词不存在就查询不到结果。ES不会再次对查询的内容进行分词处理。
需要指定两部分内容：
1）要查询的关键词
2）要查询的字段

	{
		"query":{
			"term":{
				"title":"java"
			}
		}
	}

默认使用的是standard分词器。处理英文根据空格进行分词处理。如果处理中文，是一个汉字一个关键词。
	原文：传苹果正开发新Apple TV 或集成音响和摄像头
	分词结果：
		传
		苹
		果
		正
		开
		发
		新
		Apple
		TV
		或
		集
		成
		音
		响
		和
		摄
		像
		头

4、QueryString查询，根据查询字符串查询
查询条件可以指定一个字符串，在查询之前，可以对查询条件进行分词处理，然后基于分词之后的结果再次查询。

	{
		"query":{
			"query_string":{
				"default_field":"title",
				"query":"传苹果正开发新Apple TV 或集成音响和摄像头"
			}
		}
	}

5、match查询
功能和query_string相同。

	{
		"query":{
			"match":{
				"title":"传苹果正开发新Apple TV 或集成音响和摄像头"
			}
		}
	}

6、multi_match查询
可以指定在多个字段中查询

	{
		"query":{
			"multi_match":{
				"query":"苹果",
				"fields":["title","content"]
			}
		}
	}

7、bool查询
1)组合条件查询

逻辑关系：
	must：必须满足，相当于是AND
	should：应该满足，相当于OR
	must_not:必须不能满足，相当于NOT

语法：
		{
			"query":{
				"bool":{
					"must":[],
					"should":[],
					"must_not":[],
					"filter":[]
				}
			}
		}
	
		案例：
		{
			"query":{
				"bool":{
					"must":[
						{
							"match":{
								"title":"apple"
							}
						},
						{
							"match":{
								"content":"apple"
							}
						}
					]
				}
			}	
		}

	2)filter过滤查询
		在bool查询的filter节点中可以包含多个查询条件，条件之间层层过滤。
		也可以直接使用filter进行数据的查询。filter查询是不进行打分处理。查询性能好于query。
		相关度排序：
			SEO：搜索引擎优化。

			两个指标：
				TF：关键词在文章中出现的频率。TF越大相关度越高。
				DF：所有文档中关键词出现的频率。DF越大相关度越低。例如 and
			根据TF和DF计算出一个相关度的得分，得分越高相关度越高，文档根据相关度得分进行降序排列。

		{
			"query":{
				"bool":{
					"filter":[
						{
							"term":{
								"title":"apple"
							}
						}
					]
				}
			}	
		}

8、高亮处理
在查询结果中将查询的关键词左右两边分别加上成对的html标签。
高亮的处理在查询条件中指定。

{
		"query":{
			"bool":{
				"must":[
					{
						"term":{
							"title":"apple"
						}
					}
				]
			}
		},
		"highligtht":{
			--设置高亮显示的字段
			"fields":{
				"title":{},
				"content":{}
			}
			--设置关键词的前缀
			"pre_tag":"<em>",
			--设置关键词的后缀
			"post_tag":"</em>"
		}	
	}

9、查询结果分页
在query查询条件中增加两个属性
from：起始的行号，从0开始
size：每页显示的记录数量
POST /blog/_search
{
“query”:{
“multi_match”:{
“query”:“苹果正开发”,
“fields”:[“title”,“content”]
}
},
“highlight”: {
“fields”: {
“title”: {}
, “content”: {}
},
“pre_tags”: “”,
“post_tags”: “”
},
“from”: 10,
“size”: 5
}
三、中文分词器
中文分词器都是国产的。
Ik-analyzer

1、Ik的使用方法
1）下载ES对应版本的ik分词器
2）把分词器解压缩
3）把解压之后的目录放到{ES}/plugin目录下
4）重启ES
2、分词器的测试方法
方法：
POST
url：
http://192.168.68.129:9200/_analyze
方法体：
{
“analyzer”:“standard”,
“text”:“and productivity has made it the world’s most popular Java framework.”
}

IK一旦安装之后有两个分词算法：
	ik_smart：快速分词，速度快，粒度比较粗。
	ik_max_word：最大数量分词，速度慢，粒度细。

3、索引一旦创建完毕不能修改分词器的
如果使用中文分词，应该在创建索引时，设置mapping的过程中指定使用中文分词器。

四、field的数据类型
数值类型：
int
long
float
double
字符串：
text：需要分词的字段必须使用text，只有text类型才能支持分词器。
keyword：不需要对字段的内容进行分词处理时，可以使用keyword数据类型。
例如：身份证号、手机号、订单号等。
日期：
data

字段的三个属性：
	是否分词：
		是否是text类型。例如文章的title、content都需要分词。
	是否索引：
		是否对field的内容进行索引。如果text数据类型一定需要创建索引，分词之后一定要创建索引。
		不分词也可以把field的内容添加到索引中，使用keyword数据类型。
		也可以索引field中的内容。
			例如文件的path，不需要分词，不需要索引，只需要存储即可。
			"path":{
				"type":"keyword",
				"index":false,
				"store":true
			}
	是否存储
		定义field时，store属性是否是true。
		如果是true那么就存储，false不存储。
		无论是否存储，不影响分词、创建索引、搜索。

		影响的范围就是是否能在查询结果中看到原始内容。