亿级以上的数据量 ES如何优化-Toy模板网

这篇具有很好参考价值的文章主要介绍了亿级以上的数据量 ES如何优化。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

1 增大fileSystem cache容量

	fileSystem cache存的是最近搜索过、然后缓存下来的索引文档数据，会存放在堆内存外的 系统缓存里
	给es服务器多分配内存，增大此缓存的容量，即可增加查询性能

2 es只负责存储核心关键数据

	通过es查询出关键数据以后，再通过mysql/Hbase去查询其他相关数据
		建议 ES+Hbase
	   最佳实践，某个节点的内存=  节点上文档总大小的一半
		若文档数据远远大于内存，性能肯定不行，所以只存储海量数据里的关键字段
		否则和  mysql没啥区别，缓存空间太小，热数据被频繁刷掉，每次都是io查询磁盘

3 冷热分离

	热数据放到索引a里，冷数据放到索引b里
	尽量把两种索引分开存放，热数据和冷数据分别在不同节点上
	
	以业务类型区分冷热数据
	以时间区分冷热数据
	   (定时任务 把n天前的数据 转移到冷节点里，在热节点里删除，在冷节点里新增)

4 数据预热

	自己搞个脚本/定时任务/系统
	专门去搜搜热数据
		把热数据文档缓存到内存里
			其他用户访问时就不用走io了

5 业务

	a 避免深度分页,深度分页可能会导致 查询从 级ms 变成几s
		,改设计，下拉方式刷新
			技术实现
					1 scroll api
					2 es自身的search_after 也支持这种优化方式
			这也是为什么很多网站都不允许翻页的原因
	b 避免大结果集查询
	c 避免复杂查询如 join/nested/parent-child文档关联、集合嵌套、父子文档嵌套

6 文档结构设计

	把相关数据关联处理以后，再存入es

es数据量大解决方案,elasticsearch,数据库,大数据文章来源地址https://www.toymoban.com/news/detail-516635.html

到了这里，关于亿级以上的数据量 ES如何优化的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

亿级以上的数据量 ES如何优化

1 增大fileSystem cache容量

2 es只负责存储核心关键数据

3 冷热分离

4 数据预热

5 业务

6 文档结构设计

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

微信扫一扫打赏

支付宝扫一扫领取红包，优惠每天领

二维码1

二维码2