修改ES某字段属性,同步更新旧数据
修改ES某字段属性,同步更新旧数据
·
ES中该索引数据量很大,千万级别,目前通过title字段无法实现完全匹配的搜索,以下是解决方案,记录一下。
1、通过GET 索引名/_mapping,查看索引所有字段属性。
GET test_index/_mapping
{
"test_index" : {
"mappings" : {
"properties" : {
"id" : {
"type" : "long"
}
"title" : {
"type" : "text",
"analyzer" : "ik_smart"
},
"content" : {
"type" : "text",
"analyzer" : "ik_smart"
},
"updatetime" : {
"type" : "long"
},
"status" : {
"type" : "text",
"fields" : {
"keyword" : {
"type" : "keyword",
"ignore_above" : 256
}
}
}
}
}
}
}
可以看到,title字段的属性设置为"type": "text","analyzer": "ik_smart",这就导致了不能通过这个字段达到完全匹配进行搜索,那么就要对这个字段进行修改,有没有什么方法可以实现呢。
1、首先,如果可以像mysql一样直接修改字段属性,应该是最方便的吧,但是经测试之后发现,ES索引的mapping在设置之后是不可以更改字段类型的,所以,这个方法不可行。
2、其次,可以考虑重建mapping,类似重建mysql表,把旧数据拷过去,再把旧表删掉...但是咱们这个索引的数据量大,字段多,考虑到牵扯的业务多,故不采用这种方法。
3、其实我只是要对title字段完成完全匹配的搜索,那么只要能给title字段变成keyword属性就可以实现了。经测试之后发现,ES索引的mapping虽然在建好之后不可以更改字段类型,但是可以给字段添加新的属性,我们用这个方法试试:
PUT test_index/_mapping
{
"properties": {
"title": {
"type": "text",
"analyzer": "ik_smart",
"fields": {
"keyword": {
"type": "keyword",
"ignore_above": 256
}
}
}
}
}
这里是给title字段添加keyword属性,修改完成之后,新的数据就会按照新的mapping来走了,即通过title.keyword就能实现完全匹配的搜索了!
如果想要历史数据也同步新的mapping的话,则利用_update_by_query更新即可
POST test_index/_update_by_query
至此,实现了我的需求。
更多推荐
已为社区贡献2条内容
所有评论(0)