ES中该索引数据量很大,千万级别,目前通过title字段无法实现完全匹配的搜索,以下是解决方案,记录一下。

1、通过GET 索引名/_mapping,查看索引所有字段属性。

GET test_index/_mapping
{
  "test_index" : {
    "mappings" : {
      "properties" : {
        "id" : {
          "type" : "long"
        }
        "title" : {
          "type" : "text",
          "analyzer" : "ik_smart"
        },
        "content" : {
          "type" : "text",
          "analyzer" : "ik_smart"
        },
        "updatetime" : {
          "type" : "long"
        },
        "status" : {
          "type" : "text",
          "fields" : {
            "keyword" : {
              "type" : "keyword",
              "ignore_above" : 256
            }
          }
        }
      }
    }
  }
}

可以看到,title字段的属性设置为"type": "text","analyzer": "ik_smart",这就导致了不能通过这个字段达到完全匹配进行搜索,那么就要对这个字段进行修改,有没有什么方法可以实现呢。

1、首先,如果可以像mysql一样直接修改字段属性,应该是最方便的吧,但是经测试之后发现,ES索引的mapping在设置之后是不可以更改字段类型的,所以,这个方法不可行。

2、其次,可以考虑重建mapping,类似重建mysql表,把旧数据拷过去,再把旧表删掉...但是咱们这个索引的数据量大,字段多,考虑到牵扯的业务多,故不采用这种方法。

3、其实我只是要对title字段完成完全匹配的搜索,那么只要能给title字段变成keyword属性就可以实现了。经测试之后发现,ES索引的mapping虽然在建好之后不可以更改字段类型,但是可以给字段添加新的属性,我们用这个方法试试:

PUT test_index/_mapping
{
	"properties": {
		"title": {
			"type": "text",
            "analyzer": "ik_smart",
			"fields": {
				"keyword": {
					"type": "keyword",
					"ignore_above": 256
				}
			}
		}
	}
}

这里是给title字段添加keyword属性,修改完成之后,新的数据就会按照新的mapping来走了,即通过title.keyword就能实现完全匹配的搜索了!

如果想要历史数据也同步新的mapping的话,则利用_update_by_query更新即可

POST test_index/_update_by_query

至此,实现了我的需求。

Logo

华为开发者空间,是为全球开发者打造的专属开发空间,汇聚了华为优质开发资源及工具,致力于让每一位开发者拥有一台云主机,基于华为根生态开发、创新。

更多推荐