Elasticsearch入门及常用命令和Spring中的常用操作

news/2024/7/7 5:49:40 标签: elasticsearch, spring, spring boot

入门

官网

简介

  • 一个分布式的、Restful风格的搜索引擎。
  • 支持对各种类型的数据的检索。
  • 搜索速度快,可以提供实时的搜索服务。
  • 便于水平扩展,每秒可以处理PB级海量数据。

常用术语

  • 索引:与MySQL数据库中的Database相对应
  • 类型:与MySQL数据库中的Table相对应
  • 文档: 相当于MySQL中的一条数据,采用JSON结构
  • 字段:对应MySQL数据库中的一列

在ES6.0之后,前两个术语与MySQL对应逐步发生变化,删除了类型,变成一个索引对应一张表,但是保留了类型这个单词。

在ES7.0之后,逐步删除类型。

  • 集群:多台服务器组合在一起,分布式部署,提高整体性能
  • 节点:集群中的每台服务器,称呼为节点
  • 分片:一个索引相当于一张表,分片则是对这个索引进行划分,提高并发能力。
  • 副本:对分片进行备份,一个分片可以有多个备份,提高系统可用性。

安装与配置

对于Elasticsearch的下载,最好在对应项目中,找到父级依赖所确定的版本,因为这是经过测试,与当前Spring Boot版本最匹配的版本。

往期版本下载地址

下载完成后,解压到不含有中文的目录,目录结果如下图所示:

image

版本不一致,目录结构可能会有所区别。

配置

配置文件

配置主要是配置config目录下的elasticsearch.yml文件;配置内容如下所示:

# 集群名字
cluster.name: my-application
# 数据存储位置
path.data: E:\Data\elasticsearch\es-7.15.2\data
# 运行时产生日志 存储位置
path.logs: E:\Data\elasticsearch\es-7.15.2\logs

配置结果如下图所示:

在这里插入图片描述

配置环境变量

进入配置环境变量界面步骤:系统->系统信息->高级系统设置->环境变量

在系统变量的Path中新建环境变量;如下图所示:

image

安装中文分词插件

ES默认进行英文分词,需要安装中文分词插件来对中文进行分词,即可对中文关键词进行检索。

对应Elasticsearch版本来下载对应的中文分词插件。

下载地址

首先在Elasticsearch安装目录下的,plugins目录下,新建一个ik文件夹,然后将分词插件解压到ik目录下,如下图所示:

image

在config目录下,有许多dic字典文件,里面包含很多中文词语,除此之外,若需要新增当前流行的"网络词语",需要在IKAnalyzer.cfg.xml文件中进行配置。

安装ApiPost

该工具在操作和界面上与postman类似,但是功能比postman更多,主要用来进行API设计、调试、测试等;且支持中文。

  • ApiPost官网
  • Postman官网

因为ES服务器,通过命令行存储某些数据;过长不方便,可以用ApiPost模拟网页,发送HTTP请求,往ES服务器中添加数据更为方便。

除此之外,当需要查询某些复杂数据时,也可以用ApiPost来简化数据查询。

运行Elasticsearch

可以通过双击bin目录下的elasticsearch.bat文件直接启动,也可以在命令行启动。

若出现如下报错:

[DESKTOP-CO3SKTG] error updating geoip database [GeoLite2-ASN.mmdb]

则在配置文件中添加如下配置,再重新启动即可。

ingest.geoip.downloader.enabled: false

即禁止geoip数据库的更新。

启动后结果如下:

在这里插入图片描述

常见命令操作

因为配置过环境变量,所以可以直接在任意位置的命令行中,执行ES命令。

查询ES健康状况

curl -X GET "localhost:9200/_cat/health?v"

ES默认端口为9200v表示显示标题,使用GET请求获取数据;执行结果如下所示:

在这里插入图片描述

第一行是标题,第二行是显示的数据。

  1. timestamp:表示事件
  2. cluster:集群名
  3. status:状态;green表示很健康
  4. node.total:集群的节点个数
  5. node.data:集群数据节点个数

查询节点

执行如下命令,查看集群节点;

curl -X GET "localhost:9200/_cat/nodes?v"

结果如下:

在这里插入图片描述

查看索引

执行如下命令;

curl -X GET "localhost:9200/_cat/indices?v"

结果如下:
在这里插入图片描述

结果显示当前并未有索引。

新建索引

新建索引采用的是PUT请求,执行命令如下:

curl -X PUT "localhost:9200/test"

表示新建test索引;执行结果如下图:
image

返回结果为JSON格式。

此时再次查询索引,则会显示出一条索引,且因为没有给索引进行分片和备份,所以健康状况会显示yellow,结果如下图:

image

删除索引

删除索引,使用DELETE请求,执行命令如下所示:

curl -X DELETE "localhost:9200/test"

删除名为test的索引;执行结果如下图所示:

image

此时再次查询索引则不存在名为test的索引,如下图所示:

在这里插入图片描述

使用ApiPost访问ES

查询索引

如图所示:
image

新建索引

如图所示:

image

再次查询索引即可查到名为test的索引,如下图所示:

在这里插入图片描述

删除索引

如图所示:

在这里插入图片描述

插入数据

如下图所示:

在这里插入图片描述

使用PUT请求,插入数据,会自动创建索引test_doc插入数据类型,表示占位,1则是插入数据的id;插入数据格式为JSON

查询数据

如下图所示:
image

查询使用GET请求,表示查询索引为test,占位为_docid为1的数据。

修改数据

如下图所示:

在这里插入图片描述

修改数据其实与插入数据一致,在同样的位置修改数据,在底层就是先删除该位置原先存在的数据,并插入新的数据。

删除数据

如下图所示:

image

删除数据使用的是DELETE请求,返回结果确认删除;此时再次查询,则数据不存在,如下图所示:

image

查询索引对应所有数据

如图所示:

在这里插入图片描述

test表示索引名。

根据索引的单字段条件查询

如图所示:

在这里插入图片描述

q表示查询的条件,title:互联网则表示含有title字段,且字段内容含有互联网的数据。

且ES在查询时,会先将条件分割为多个词条,然后去查询包含对应字条的数据。

根据索引的多字段条件查询

如图所示:

在这里插入图片描述

多字段查询格式如图所示;query表示条件,multi_match表示多个匹配,fields则表示匹配条件的字段。

Spring整合Elasticsearch

引入依赖

<!-- https://mvnrepository.com/artifact/org.springframework.boot/spring-boot-starter-data-elasticsearch -->
<dependency>
    <groupId>org.springframework.boot</groupId>
    <artifactId>spring-boot-starter-data-elasticsearch</artifactId>
</dependency>

配置Elasticsearch

在配置文件application.properties中配置如下内容:

# 连接集群节点
spring.elasticsearch.uris=localhost:9200

出现Redis与Elasticsearch发生Netty冲突

主要是Redis与Elasticsearch都调用了NettyRuntime类的setAvailableProcessors方法。

解决办法

在Application启动类中,添加如下内容:

@PostConstruct	// 所注解的方法 会在构造器调用完以后调用
	public void init() {
		// 解决Netty启动冲突问题
		// 由Netty4Utils.setAvailableProcessors()得
		System.setProperty("es.set.netty.runtime.available.processors", "false");
	}

配置实体

即配置项目实体与ElasticSearch相对应;即可自动生成与某实体相对应的索引;具体实体类配置如下所示:

/**
 * @author 花木凋零成兰
 * @date 2024/3/4 20:16
 */
@Document(indexName = "discusspost")    // 与Elasticsearch关联 设置索引 注意不能出现大写字母
public class DiscussPost {

    @Id // 与ES索引对应字段
    private int id;

    @Field(type = FieldType.Integer)    // type字段类型
    private int userId;

    /**
     * analyzer时候的解析器   ik_max_word 尽可能的拆分
     * searchAnalyzer搜索时候的解析器   ik_smart 灵活的拆分
     */
    @Field(type = FieldType.Text, analyzer = "ik_max_word", searchAnalyzer = "ik_smart")
    private String title;

    @Field(type = FieldType.Text, analyzer = "ik_max_word", searchAnalyzer = "ik_smart")
    private String content;

    @Field(type = FieldType.Integer)
    private int type;

    @Field(type = FieldType.Integer)
    private int status;

    @Field(type = FieldType.Date)
    private Date createTime;

    @Field(type = FieldType.Integer)
    private int commentCount;

    @Field(type = FieldType.Double)
    private double score;

}

配置接口

配置完实体类后,还需要配置对ES操作接口,即接口内自动包含了与ES有关的API;接口配置如下所示:

/**
 * ES操作接口
 * @author 花木凋零成兰
 * @date 2024/3/25 21:14
 */
@Repository
public interface DiscussPostRepository extends ElasticsearchRepository<DiscussPost, Integer> {
}

自定义接口继承ElasticsearchRepository<K, V>类,自定义接口内即有关于ES操作的API,K指操作的数据实体类型,V指数据实体类型的id类型。

测试

在ES7中,ElasticsearchRepository主要用来实现简单的对数据增删改查,即主要用于实现简单操作;ElasticsearchRestTemplate类则主要用来实现对数据的复杂查询等;即主要用户复杂的数据操作。

测试代码如下:

/**
 * @author 花木凋零成兰
 * @date 2024/3/25 21:15
 */
@SpringBootTest
@ContextConfiguration(classes = Application.class)		// 使用Application类的配置
public class ElasticsearchTests {

    @Autowired
    private DiscussPostMapper discussPostMapper;

    @Autowired()
    private DiscussPostRepository discussPostRepository;

    @Autowired
    private ElasticsearchRestTemplate elasticsearchRestTemplate; // 多用于复杂查询

    @Test
    public void insertTest() {
        // 测试插入数据 若不存在索引 会自动创建
        discussPostRepository.save(discussPostMapper.selectDiscussPostById(241));   // 每次插入一条数据
        discussPostRepository.save(discussPostMapper.selectDiscussPostById(242));
        discussPostRepository.save(discussPostMapper.selectDiscussPostById(243));
    }

    @Test
    public void insertListTest() {
        discussPostRepository.saveAll(discussPostMapper.selectDiscussPosts(101, 0, 100));   // 一次性插入多条数据
        discussPostRepository.saveAll(discussPostMapper.selectDiscussPosts(102, 0, 100));   // 一次性插入多条数据
        discussPostRepository.saveAll(discussPostMapper.selectDiscussPosts(103, 0, 100));   // 一次性插入多条数据
        discussPostRepository.saveAll(discussPostMapper.selectDiscussPosts(111, 0, 100));   // 一次性插入多条数据
        discussPostRepository.saveAll(discussPostMapper.selectDiscussPosts(112, 0, 100));   // 一次性插入多条数据
        discussPostRepository.saveAll(discussPostMapper.selectDiscussPosts(131, 0, 100));   // 一次性插入多条数据
        discussPostRepository.saveAll(discussPostMapper.selectDiscussPosts(132, 0, 100));   // 一次性插入多条数据
        discussPostRepository.saveAll(discussPostMapper.selectDiscussPosts(133, 0, 100));   // 一次性插入多条数据
        discussPostRepository.saveAll(discussPostMapper.selectDiscussPosts(134, 0, 100));   // 一次性插入多条数据
    }

    @Test
    public void updateTest() {
        DiscussPost discussPost = discussPostMapper.selectDiscussPostById(231);
        discussPost.setContent("我是Java程序员,我要好好学Java!");
        discussPostRepository.save(discussPost);    // 在同样id处重新插入数据 覆盖原先数据
    }

    @Test
    public void deleteTest() {
        discussPostRepository.deleteById(231);  // 根据id删除数据
    }

    @Test
    public void deleteAllTest() {
        discussPostRepository.deleteAll();  // 一次性删除所有数据
    }

    @Test
    public void testSearch() {
        // 构造搜索条件
        NativeSearchQuery searchQuery = new NativeSearchQueryBuilder()
                .withQuery(QueryBuilders.multiMatchQuery("互联网寒冬", "title", "content"))    // 构建搜索条件 多字段查询内容
                .withSorts(
                        SortBuilders.fieldSort("type").order(SortOrder.DESC), // 构建排序顺序 先按照type倒序排
                        SortBuilders.fieldSort("score").order(SortOrder.DESC), // 再按score倒序排
                        SortBuilders.fieldSort("createTime").order(SortOrder.DESC)  // 再按创建时间 倒序排
                )
                .withPageable(PageRequest.of(0, 10))    // 分页查询 第几页, 该页显示数据数量
                .withHighlightFields(   // 配置字段高亮显示
                        new HighlightBuilder.Field("title").preTags("<em>").postTags("</em>"),
                        new HighlightBuilder.Field("content").preTags("<em>").postTags("</em>")
                )
                .build();
        SearchHits<DiscussPost> searchHits = elasticsearchRestTemplate.search(searchQuery, DiscussPost.class);
        if (searchHits.getTotalHits() <= 0) {      // 若查询无数据
            new PageImpl<DiscussPost>(null, PageRequest.of(0, 20), 0);
        }
        List<DiscussPost> discussPostList = searchHits.stream().map(SearchHit::getContent).collect(Collectors.toList());    // 将查询的数据转化为List集合
        Page<DiscussPost> page = new PageImpl<>(discussPostList, searchQuery.getPageable(), searchHits.getTotalHits());
        System.out.println(page.getTotalElements());  // 获取总数
        System.out.println(page.getNumber());    // 获取页码
        System.out.println(page.getSize());  // 获取每页个数
        System.out.println(page.getTotalPages());    // 分页总数
        for (DiscussPost discussPost : page) {
            System.out.println(discussPost);    // 输出查询结果
        }

    }

    @Test
    public void testSearchByTemplateHighLight() {   // 按条件查询数据 实现高亮
        NativeSearchQuery searchQuery = new NativeSearchQueryBuilder()
                .withQuery(QueryBuilders.multiMatchQuery("互联网寒冬", "title", "content"))    // 构建搜索条件 多字段查询内容
                .withSorts(
                        SortBuilders.fieldSort("type").order(SortOrder.DESC), // 构建排序顺序 先按照type倒序排
                        SortBuilders.fieldSort("score").order(SortOrder.DESC), // 再按score倒序排
                        SortBuilders.fieldSort("createTime").order(SortOrder.DESC)  // 再按创建时间 倒序排
                )
                .withPageable(PageRequest.of(0, 10))    // 分页查询 第几页, 该页显示数据数量
                .withHighlightFields(
                        new HighlightBuilder.Field("title").preTags("<em>").postTags("</em>"),
                        new HighlightBuilder.Field("content").preTags("<em>").postTags("</em>")
                )   // 配置字段高亮显示
                .build();
        SearchHits<DiscussPost> searchHits = elasticsearchRestTemplate.search(searchQuery, DiscussPost.class);
        // SearchPage<DiscussPost> page = SearchHitSupport.searchPageFor(searchHits, searchQuery.getPageable());

        // 获取高亮结果集
        List<DiscussPost> list = new ArrayList<>();
        for (SearchHit<DiscussPost> searchHit : searchHits) {
            DiscussPost discussPost = searchHit.getContent();
            if (searchHit.getHighlightFields().get("title") != null) {
                discussPost.setTitle(searchHit.getHighlightFields().get("title").get(0));
                // discussPost.setContent(searchHit.getHighlightField("content").toString());
            }
            if (searchHit.getHighlightFields().get("content") != null) {
                discussPost.setContent(searchHit.getHighlightFields().get("content").get(0));
                // discussPost.setContent(searchHit.getHighlightField("content").toString());
            }
            list.add(discussPost);
        }
        // 组装分页对象
        Page<DiscussPost> pageInfo = new PageImpl<>(list, searchQuery.getPageable(), searchHits.getTotalHits());
        System.out.println(pageInfo.getTotalElements());    // 获取查询得到数据总数
        System.out.println(pageInfo.getTotalPages());   // 获取总页数
        System.out.println(pageInfo.getNumber());   // 获取当前页码
        System.out.println(pageInfo.getSize());     // 获取当前页面个数
        // 输出分页结果
        for (DiscussPost discussPost : pageInfo) {
            System.out.println(discussPost);
        }

    }
}

因测试数据过多,此处只展示最后一个测试方法执行成功结果;如下所示:

image


http://www.niftyadmin.cn/n/5459997.html

相关文章

OpenCV的安装与配置

OpenCV安装 OpenCV&#xff0c;全称Open Source Computer Vision Library&#xff0c;是一个开源的计算机视觉库&#xff0c;它包含了大量的图像处理函数和计算机视觉算法。为了更好地学习和应用OpenCV&#xff0c;首先需要将其正确地安装到我们的计算机上。以下是一份关于Ope…

Mysql从0到1 —— CRUD/索引/事务

文章目录 1 预备知识1.1 安装1.2 登录 & 退出1.3 配置文件my.cnf 2 基础知识2.1 链接服务器2.2 什么是数据库2.3 基本使用2.3.1创建表2.3.2 插入数据 2.4 服务器、数据库、表的关系2.5 SQL分类2.6 存储引擎 3 Mysql数据库的操作3.1 创建和删除3.2 字符集和校验规则3.3 查看…

ssm框架笔记-maven

html是骨头 css使皮肤 js是你能做的动作 MAVEN 依赖管理&#xff1a;1.声明dependenciys标签 2.maven search3。 版本号提取 3.$引用 3.2依赖传递和冲突 依赖传递指的是当一个模块或库 A 依赖于另一个模块或库 B&#xff0c;而 B 又依赖于模块或库 C&#xff0c;那么 A 会间…

如何划分训练集、测试集、验证集

训练集、测试集和验证集是在机器学习和数据科学中常用的术语&#xff0c;用于评估和验证模型的性能。它们通常用于监督学习任务中。 1. 训练集&#xff08;Training Set&#xff09;&#xff1a;训练集是用于训练机器学习模型的数据集。在训练期间&#xff0c;模型使用训练集中…

【JavaScript算法】DOM树层级显示

题目描述&#xff1a; 上述表达式的输出结果为 [DIV] [P, SPAN, P, SPAN] [SPAN, SPAN]直接上代码 let tree document.querySelector(".a"); function traverseElRoot(elRoot) {const result [];function traverse(element, level) {if (!result[level]) {resul…

android 13 相册和拍照问题

android 在13以下。拍照和从相册选取图片需要使用 存储权限&#xff0c;相机权限。 在使用时候 需要声申请 Manifest.permission.WRITE_EXTERNAL_STORAGEManifest.permission.CAMERA 这2个权限。 但是在android 13以及以上时候&#xff0c;不需要申请 Manifest.permission…

深入解析大数据Scala面试题及参考答案(持续更新)

Scala,作为一种多范式编程语言,因其强大的功能性和与Java的互操作性,在大数据和并发编程领域备受青睐。本文将深入探讨10个常见的Scala面试题,并提供详尽的参考答案,以期帮助读者在面试中展现其Scala编程的深厚功底。 目录 1. Scala的基本特性是什么? 2. 什么是函数式…

Filter、Listener、AJAX、Vue、Element

Filter 概念&#xff1a;Filter 表示过滤器&#xff0c;是JavaWeb三大组件(Servlet、Filter、 Listener)之一。 过滤器可以把对资源的请求拦截下来&#xff0c;从而实现一些特殊的功能。 过滤器一般完成一些通用的操作&#xff0c;比如&#xff1a;权限控制、统一编码处理、敏感…