缓存之美——如何选择合适的本地缓存?

这篇具有很好参考价值的文章主要介绍了缓存之美——如何选择合适的本地缓存?。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

1、简介

小编最近在使用系统的时候,发现尽管应用已经使用了redis缓存提高查询效率,但是仍然有进一步优化的空间,于是想到了比分布式缓存性能更好的本地缓存,因此对领域内常用的本地缓存进行了一番调研,有早期的Guava缓存、在Guava上进一步传承的Caffine以及自称在Java中使用最广泛的EhCache,那么我们该怎么选择适合自己应用的缓存呢,小编下面会简单介绍,并将以上缓存进行一个对比,希望帮助大家选择最适合自己系统的本地缓存。

2、Guava缓存简介

Guava cache是Google开发的Guava工具包中一套完善的JVM本地缓存框架,底层实现的数据结构类似于ConcurrentHashMap,但是进行了更多的能力拓展,包括缓存过期时间设置、缓存容量设置、多种淘汰策略、缓存监控等,下面简单介绍下这些功能及其使用方式。

2.1、缓存过期时间设置

Guava的过期时间设置有基于创建时间和最后一次访问时间两种策略.

(1) 基于创建时间

通过对比缓存记录的插入时间来判断,比如设置过期时间为5分钟,不管中间有没有访问,到时过期。

public Cache<String, String> createCache() {    
    return CacheBuilder.newBuilder()
    .expireAfterWrite(5L, TimeUnit.MINUTES)
    .build();
}

(2) 基于过期时间

通过对比最近最后一次的访问时间,比如设置5分钟,每次访问之后都会刷新过期时间为5分钟,只有持续5分钟没有被访问到才会过期。

public Cache<String, String> createCache() {    
    return CacheBuilder.newBuilder()
    .expireAfterAccess(5L, TimeUnit.MINUTES)
    .build();
}

2.2、缓存容量和淘汰策略设置

Guava cache是内存型缓存,有内存溢出风险,因此需要设置缓存的最大存储上限,通过缓存的条数或每条缓存的权重来判断是否达到了设定阈值,当缓存的数据量达到设定阈值之后,Guava cache支持使用FIFO和LRU的策略对缓存记录采取淘汰的措施。

(1)限制缓存记录条数

public Cache<String, User> createCache() {    
    return CacheBuilder.newBuilder()
    .maximumSize(100L)
    .build();
}

(2)限制缓存记录权重

public Cache<String, User> createCache() {    
    return CacheBuilder.newBuilder()
    .maximumWeight(100L)
    .weigher((key, value) (int) Math.ceil(instrumentation.getObjectSize(value) / 1024L))       
    .build();
}

使用限制缓存记录权重时要先计算weight的value对象的字节数,每1kb字节作为一个权重,对比限制缓存记录,我们就能将缓存的总占用限制在100kb左右。

2.3缓存监控

缓存记录的加载和命中情况是评价缓存处理能力的重要指标,Guava cache提供了stat统计日志对这两个指标进行了统计,我们只需要在创建缓存容器的时候加上recordStats就可以开启统计。

public Cache<String, User> createCache() {    
    return CacheBuilder.newBuilder()
    .recordStats()
    .build();
}

2.4 Guava cache的优劣势和适用场景

优劣势:Guava cache通过内存处理数据,具有减少IO请求,读写性能快的优势,但是受内存容量限制,只能处理少量数据的读写,还有可能对本机内存造成压力,并且在分布式部署中,会存在不同机器节点数据不一致的情况,即缓存漂移。

适用场景:读多写少,对数据一致性要求不高的场景。

3、Caffeine简介

Caffeine同样是Google开发的,是在Guava cache的基础上改良而来的,底层设计思路、功能和使用方式与Guava非常类似,但是各方面的性能都要远远超过前者,可以看做是Guava cache的升级版,因此,之前使用过Guava cache,也能够很快的上手Caffeine,下面是Caffeine和Guava cache的缓存创建对比,基本可以无门槛过渡。

public Cache<String, String> createCache() {
    return Caffeine.newBuilder()
        .initialCapacity(1000)
        .maximumSize(100L)
        .expireAfterWrite(5L, TimeUnit.MINUTES)

        .recordStats()
        .build();
}

public Cache<String, String> createCache() {    
    return CacheBuilder.newBuilder()
    .initialCapacity(1000)
    .maximumSize(100L)
    .expireAfterWrite(5L, TimeUnit.MINUTES)
    .recordStats()
    .build();
}

那么Caffeine底层又做了哪些优化,才能让其性能高于Guava cache呢?主要包含以下三点:

3.1、对比Guava cache的性能主要优化项

(1)异步策略

Guava cache在读操作中可能会触发淘汰数据的清理操作,虽然自身也做了一些优化来减少读的时候的清理操作,但是一旦触发,就会降低查询效率,对缓存性能产生影响。而在Caffeine支持异步操作,采用异步处理的策略,查询请求在触发淘汰数据的清理操作后,会将清理数据的任务添加到独立的线程池中进行异步操作,不会阻塞查询请求,提高了查询性能。

 文章来源地址https://www.toymoban.com/news/detail-780184.html

 

 

 

(2)ConcurrentHashMap优化

Caffeine底层都是通过ConcurrentHashMap来进行数据的存储,因此随着Java8中对ConcurrentHashMap的调整,数组+链表的结构升级为数组+链表+红黑树的结构以及分段锁升级为syschronized+CAS,降低了锁的粒度,减少了锁的竞争,这两个优化显著提高了Caffeine在读多写少场景下的查询性能。

 

(3)新型淘汰算法W-TinyLFU

传统的淘汰算法,如LRU、LFU、FIFO,在实际的缓存场景中都存在一些弊端,如FIFO算法,如果缓存使用的频率较高,那么缓存数据会一直处在进进出出的状态,间接影响到缓存命中率。LRU算法,在批量刷新缓存数据的场景下,可能会将其他缓存数据淘汰掉,从而带来缓存击穿的风险。LFU算法,需要保存缓存记录的访问次数,带来内存空间的损耗。

因此,Caffeine引入了W-TinyLFU算法,由窗口缓存、过滤器、主缓存组成。缓存数据刚进入时会停留在窗口缓存中,这个部分只占总缓存的1%,当被挤出窗口缓存时,会在过滤器汇总和主缓存中淘汰的数据进行比较,如果频率更高,则进入主缓存,否则就被淘汰,主缓存被分为淘汰段和保护段,两段都是LRU算法,第一次被访问的元素会进入淘汰段,第二次被访问会进入保护段,保护段中被淘汰的元素会进入淘汰段,这种算法实现了高命中率和低内存占用。更详细的解释可以参考论文:https://arxiv.org/pdf/1512.00727.pdf

 

 

 

3.2、Caffeine的优劣势和适用场景

优势:对比Guava cache有更高的缓存性能,劣势:仍然存在缓存漂移的问题;JDK版本过低无法使用

适用场景:1、适用场景:读多写少,对数据一致性要求不高的场景;2、纯内存缓存,JDK8及更高版本中,追求比Guava cache更高的性能。

4、Ehcache简介

Guava cache和Caffeine都是JVM缓存,会受到内存大小的制约,最新的Ehcache采用堆内缓存+堆外缓存+磁盘的方式,打破了这一制约。堆内缓存就是被JVM管理的那一部分缓存,而堆外缓存,就是在内存中另外在开辟一块不被JVM管理的部分。堆外缓存这部分既可以享受内存的高速读写能力,而且又避免的JVM频繁的GC,缺点是需要自行清理数据。

 

 

 

下面是Ehcache缓存的创建,指定了堆内、堆外缓存和磁盘缓存的大小。

ResourcePoolsBuilder.newResourcePoolsBuilder()
    .heap(20, MemoryUnit.MB)
    .offheap(10, MemoryUnit.MB)
    .disk(5, MemoryUnit.GB);

为了解决缓存漂移的问题,Ehcache支持通过集群的方式,实现了分布式节点之间的数据互通。关于Ehcache的集群策略,后续文章再详细阐述。

5、不同本地缓存对比

框架 命中率 速度 回收算法 使用难度 集群 适用场景
Guava cache 第三 LRU、LFU、FIFO 不支持 读多写少,允许少量缓存偏移
Caffeine 第一 W-TinyLFU 不支持 读多写少,允许少量缓存偏移,能用Caffeine就别用Guava cache
Ehcache 第二 LRU、LFU、FIFO 支持 分布式系统中对数据一致性要求高

 

作者:京东保险 郭盼

来源:京东云开发者社区 转载请注明来源

 

到了这里,关于缓存之美——如何选择合适的本地缓存?的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 工业状态监测如何选择合适的无线技术?

    工业领域的状态监测在提高生产效率和产品质量方面起着关键作用。过去依赖于预防性维护和例行检查的方式已经不再能满足日益复杂的生产需求,随着工业物联网(IIoT)的兴起,设备状态监测逐渐成为一种关键策略,催生了预测性维护的实施。 图.设备状态监测(iStock)

    2024年02月10日
    浏览(49)
  • 解析数据可视化工具:如何选择最合适的软件

    在当今信息爆炸的时代,数据已成为各行各业的重要资源。为了更好地理解和分析数据,数据可视化成为一种必不可少的工具。市面上数据可视化工具不说上千也有上百,什么帆软、powerbi、把阿里datav,腾讯云图、山海鲸可视化等等等等,让我们选的抓狂。   对于新手小白来

    2024年02月15日
    浏览(53)
  • 在线办公时代,如何选择合适的云办公软件?

    随着数字经济的发展和疫情的影响,云办公已成为企业数字化转型和远程协作的必然趋势。云办公的发展不仅意味着工具与技术的迭代,更是组织环节与业务流程的进化。云办公可以突破传统办公模式在地域、时间、终端设备上的限制,既简化了员工与团队的办公流程,给用

    2024年02月04日
    浏览(53)
  • 数据搜索的实用工具:如何选择合适的搜索引擎

    数据搜索是现代人工智能和大数据技术的基石,它为各种应用提供了强大的支持。随着数据规模的不断扩大,传统的搜索方法已经无法满足需求。因此,选择合适的搜索引擎成为了关键。本文将介绍数据搜索的实用工具及其选择原则,以及相关算法原理、具体操作步骤和数学

    2024年04月16日
    浏览(33)
  • 如何选择合适的GPU进行渲染?最佳渲染GPU推荐

    以下是为 3D 艺术选择显卡的一些技巧: 考虑一下您的预算 : 显卡的价格从几百元到几万元不等。在开始购物之前确定您愿意花多少钱。 阅读评论 : 网上有很多关于显卡的评论,阅读它们以了解特定卡的性能如何。 决定您要创作哪种 3D 艺术 : 如果您刚刚开始,您可能不

    2024年02月13日
    浏览(58)
  • 构建稳定的爬虫系统:如何选择合适的HTTP代理服务商

    在构建一个稳定、高效的爬虫系统中,选择合适的HTTP代理服务商是至关重要的一步。本文将介绍如何选取可靠且性能优秀的HTTP代理服务供应商,来完成搭建一个强大而稳定的爬虫系统。 1.了解不同类型和特点 -免费公开代理服务器:提供免费但可能存在限制或不够安全; -收费

    2024年02月10日
    浏览(49)
  • 腾讯云服务器配置怎么选择?CPU内存带宽系统盘如何选合适?

    腾讯云服务器配置包括CPU内存、公网带宽和系统盘,云服务器分为CVM服务器和轻量应用服务器,腾讯云服务器网来详细说下腾讯云服务器配置怎么选择?到底是选择云服务器CVM还是轻量应用服务器?CPU内存选择几核几G?公网带宽多大合适?云服务器系统盘类型怎么选择? 目

    2024年02月11日
    浏览(56)
  • 如何根据需求选择合适的数据库管理工具?Navicat OR DBeaver

    1.写在前面 在阅读本文之前,糖糖给大家准备了Navicat和DBeaver安装包,在公众号内回复“Navicat”或“DBeaver”或\\\"数据库管理工具\\\"来下载。 2. 引言 对于测试而言,在实际工作中往往会用到数据库,那么选择使用哪种类型的数据库管理工具显的尤为重要,我们常用的数据库管理

    2023年04月17日
    浏览(50)
  • 服务器中E5和I9的区别是什么,如何选择合适的配置

    随着科技的进步,服务器处理器的性能在不断攀升。其中,Intel的E5和I9系列处理器在业界具有广泛的影响力。而当我们在选择服务器的时候会有各种各样的配置让我们眼花缭乱不知道该怎么去选择,下面我跟大家分享一下E5跟I9有什么区别,方便我们在选择的时候有一个方向去

    2024年01月24日
    浏览(56)
  • 如何高效的学习接口自动化测试?从零开始学习接口自动化测试:选择合适的学习资源和编程语言

    目录 引言: 一、学习前的准备 二、选择合适的学习资源 三、实践中学习 四、总结 在日常的软件开发过程中,接口自动化测试是一个非常重要的环节。接口自动化测试可以帮助我们快速准确地检测出软件中的缺陷,提高软件的质量和稳定性。但是,要学习接口自动化测试并

    2024年02月06日
    浏览(65)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包