首页技术总结正文内容

【Elasticsearch系列】Elasticsearch中的分页

技术总结

更新时间：2024-12-22 11:08:50 1

admin 管理员组

文章数量: 886992

💝💝💝欢迎来到我的博客，很高兴能够在这里和您见面！希望您在这里可以感受到一份轻松愉快的氛围，不仅可以获得有趣的内容和知识，也可以畅所欲言、分享您的想法和见解。

推荐:kwan 的首页,持续学习,不断总结,共同进步,活到老学到老
导航
檀越剑指大厂系列:全面总结 java 核心技术,jvm,并发编程 redis,kafka,Spring,微服务等
常用开发工具系列:常用的开发工具,IDEA,Mac,Alfred,Git,typora 等
数据库系列:详细总结了常用数据库 mysql 技术点,以及工作中遇到的 mysql 问题等
新空间代码工作室:提供各种软件服务,承接各种毕业设计,毕业论文等
懒人运维系列:总结好用的命令,解放双手不香吗?能用一个命令完成绝不用两个操作
数据结构与算法系列:总结数据结构和算法,不同类型针对性训练,提升编程思维,剑指大厂

非常期待和您一起在这个小小的网络世界里共同探索、学习和成长。💝💝💝 ✨✨ 欢迎订阅本专栏 ✨✨

博客目录

- 一.基本介绍
- 二.代码实战
- - 1.console 查询
  - 2.代码查询

一.基本介绍

在 Elasticsearch (ES) 中进行分页查询主要有三种方式：from + size、search_after 和 scroll。每种方式都有其适用场景和优缺点。

from + size：这是最基本的分页方式，通过指定from（起始位置）和size（每页数量）来获取数据。它简单易用，适用于数据量不大或不需要深度分页的场景。但是，当from值很大时，性能会下降，因为需要合并和排序所有分片返回的结果。ES 默认的max_result_window限制了最大分页数，通常为 10000，这意味着from + size的值不能超过这个限制。如果需要处理大量数据或深度分页，这种方式可能不是最佳选择。
search_after：这种方式适用于需要深度分页的场景，它通过使用上一页的最后一个文档的排序值来获取下一页数据，因此可以有效地避免深度分页的性能问题。这种方式的优点是性能较好，不存在深度分页问题，能够反映数据的实时变更。但是，它需要一个全局唯一的字段来排序，且实现相对复杂，每次查询都需要上次查询的结果。
scroll：scroll API 允许你“游走”或“滚动”通过大量结果，而不需要使用深度分页。它通过维护一个活跃的搜索上下文来实现，这个上下文会在指定的时间内保持开启状态。scroll 适用于需要遍历大量数据的场景，但牺牲了数据的实时性，因为 scroll 查询是基于初始查询时的快照数据。这种方式的优点是查询效率高，尤其适合于数据导出或批量处理，但缺点是需要维护 scroll ID 和历史快照，对服务器资源有一定的消耗。

选择哪种分页方式取决于具体的需求和场景。对于大多数常见的分页需求，from + size可能足够使用。但如果需要处理大量数据或进行深度分页，那么scroll或search_after可能是更好的选择。在实际应用中，需要根据数据量、查询频率、实时性要求等因素综合考虑。

二.代码实战

1.console 查询

GET _search
{
  "query": {
    "match_all": {}
  }
}

GET /

GET /_cluster/health


GET /_cat/health?v


GET /db01_v1_20240903-index/_search



GET /db01_v1_20240903-index/_search?from=0&size=10



POST /db01_v1_20240903-index/_search
{
  "from": 0,
  "size": 10,
  "_source": ["_id", "id", "source", "target", "description", "weight"],
  "query": {
      "query_string": {
          "query": "source:*應用*",
          "default_field": "source",
          "fuzziness": 1
      }
  }

}

GET /db01_v1_20240903-index/_search?from=0&size=10

POST /db01_v1_20240903-index/_search
{
  "from": 0,
  "size": 10,
  "query": {
    "query_string": {
     "query": "subject_id:*我照顧的人*",
      "default_field": "subject_id",
      "fuzziness": 1
    }
  }
}

POST /db01_v1_20240903-index/_search
{
  "from": 0,
  "size": 10,
  "query": {
    "match": {
      "subject_id": {
        "query": "照顧",
        "fuzziness": 1
      }
    }
  }
}

2.代码查询

def list_label_readable(self, name, page, page_size, label):
    all_docs = []
    if page < 1 or page_size <= 0:
        return all_docs, 0
    label_dict = QueryEnum.query_info.value[label]
    index_name = self.index_prefix + label_dict['index_name']
    response = self._es.search(
        index=index_name,
        body={
            "from": (page - 1) * page_size,
            "size": page_size,
            "_source": label_dict['_source'],
            "query": {
                "query_string": {
                    "query": f"{label_dict['query_name']}:*{name}*",
                    "default_field": f"{label_dict['query_name']}",
                    "fuzziness": label_dict['fuzziness']
                }
            }
            if label == QueryEnum.ENTITIES.value or label == QueryEnum.RELATIONSHIPS.value else
            {
                "match": {
                    f"{label_dict['query_name']}":
                        {
                            "query": f"{name}",
                            "fuzziness": label_dict['fuzziness']
                        }
                }
            },
        },
    )
    total = response['hits']['total']['value']
    hits = response['hits']['hits']
    for hit in hits:
        _source = hit['_source']
        _source['_id'] = hit['_id']
        all_docs.append(_source)
    return all_docs, total

觉得有用的话点个赞 👍🏻 呗。
❤️❤️❤️本人水平有限，如有纰漏，欢迎各位大佬评论批评指正！😄😄😄

💘💘💘如果觉得这篇文对你有帮助的话，也请给个点赞、收藏下吧，非常感谢!👍 👍 👍

🔥🔥🔥Stay Hungry Stay Foolish 道阻且长,行则将至,让我们一起加油吧！🌙🌙🌙

本文标签：分页系列 elasticsearch

版权声明：本文标题：【Elasticsearch系列】Elasticsearch中的分页内容由网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：http://www.freenas.com.cn/jishu/1726436675h960354.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

发表评论

全部评论 0

暂无评论

技术交流 – FreeNAS中文网

【Elasticsearch系列】Elasticsearch中的分页

博客目录

一.基本介绍

二.代码实战

1.console 查询

2.代码查询

更多相关文章

SLAM小白入门系列（1）Ubuntu双系统的安装与重装

伴你装系统系列（上篇）：Windows10

安装Windows 2008 操作系统时加载ServeRAID-MR10系列阵列卡驱动

【愚公系列】2023年10月 .NET CORE工具案例-HTTP请求之WebApiClientCore

lenovo联想笔记本Thinkpad系列X1 Carbon Gen10,X1 Yoga Gen7(21CB,21CC,21CD,21CE)原厂Windows11系统镜像

华为 AR系列路由器密码重置

【愚公系列】2023年11月 大数据教学课程 002-Linux介绍和常用命令

Elasticsearch 安装-Windows

【愚公系列】2021年12月 网络工程-修改windows系统密码

WINDOWS 7驱动开发系列（六）-认识内核的对象

运维系列&amp;AI系列&amp;Lenovo-G双系统系列（前传-装之前搜索的）：ubuntu系统开机黑屏，左上角光标闪烁的解决办法

知识分享系列一：5G基础知识

office系列软件（word、ppt、excel）打不开的解决方案

android各版本第一次出现的手机号码,谷歌Pixel系列首次Android 10更新：我们都应该知道些什么...

【AI绘图 丨 Stable_diffusion 系列教程一】— Window 环境 | Stable Diffusion入门教程 及安装（上篇）

coreelec 下载app_DY的瞎折腾系列 篇十三：N1多媒体系统CoreELEC升级指南

浏览器响应状态码（Response Status Code）大全【建议收藏系列】

将现有windows封装iso_【原创】最新WIN10系统封装教程2019系列(一)——定制母盘

在Windows环境下安装Elasticsearch 8.8.2

关于将主力从Win11迁移到Debian12的一系列折腾

发表评论

推荐文章

BUUCTF MISC WP

智慧城市建设，选择紫光云的连云港有啥不一样？

手机进水声音变小怎么办

小米刷原生android系统下载地址,小米6刷原生安卓8.0下载|小米6刷原生安卓p 免费版_附教程_最火软件站...

stc89c52单片机介绍_DIY迷你单片机学习板

热门文章

腾讯云总结

【BUUCTF

腾讯QQ中批量删除好友的方法

python的openpyxl模块（Excel 2010）

Ubuntu20.04系统RTL8852CE网卡没有wifi连接选项问题解决

Windows7下配置JMeter安装环境

电脑windows系统有没有必要更新

FREENAS WINDOWS SMB 公用文件夹的共享设置。。

Windows 7 远程登录 Fedora 16

win7补丁下载

最新文章

Raid技术

LSI_阵列卡操作手册

破解Centos7_root用户密码

Redhat重置Root用户密码方法

远程批量修改linux服务器密码的脚本

如何将必应（Bing）的背景图片设定成 Windows 7 的主题

Windows 7 IIS (HTTP Error 500.21 - Internal Server Error)解决

Windows 7中使用HomeGroup需要打开的端口

GRUB 2：恢复被Windows 7覆盖的Ubuntu 9.10

win7下cuda8.0安装跑gpu版tensorflow

【愚公系列】2023年11月大数据教学课程 002-Linux介绍和常用命令

【愚公系列】2021年12月网络工程-修改windows系统密码

运维系列&AI系列&Lenovo-G双系统系列（前传-装之前搜索的）：ubuntu系统开机黑屏，左上角光标闪烁的解决办法

【AI绘图丨 Stable_diffusion 系列教程一】— Window 环境 | Stable Diffusion入门教程及安装（上篇）

coreelec 下载app_DY的瞎折腾系列篇十三：N1多媒体系统CoreELEC升级指南