分布式篇-D 分布式数据同步
作者:田超凡
1 缓存一致性产生背景
答:当需要频繁访问数据库的时候,虽然数据库底层基于B+索引检索数据,但是仍然会十分消耗磁盘IO资源,导致数据库访问压力增加。
此时可以基于缓存设计来减轻数据库访问压力。
2 多级缓存架构设计方案
答:多级缓存架构设计采用的设计模式是装饰者模式。
- 首先是JVM内置缓存,如ehcache、oscache。数据同步可以基于RMI机制(JVM和JVM之间的通讯)实现,效率比较低。
- 其次是外置缓存,如redis、memcached等,先查内置缓存,内置缓存没有再查外置缓存,外置缓存没有再查数据库,然后同步数据到外置和内置缓存中。
3 Mysql与Redis缓存一致性原理
答:
- 基本查询流程:
首先从redis缓存中查询数据,如果能查到就直接返回客户端,如果不能查到就再到数据库中查询,把查询到的数据同步到redis缓存中,再返回查询结果给客户端。
- 基本数据同步实现原理:
大多数场景Redis都是作为只读缓存,当mysql做增量写操作时,会同步到Redis,此时分以下几种情况讨论:
- Insert db,insert redis 增量同步
- Update db,清除redis缓存,懒加载
- Update db,更新redis缓存,增量同步
- Delete db, 清除redis缓存,增量同步
4 如果数据库数据发生变化,如何同步给Redis
答:
- 删除redis缓存,增量同步
- 基于MQ异步同步
- 基于canal异步同步
- 基于canal+MQ异步同步
5 canal数据同步实现原理
答:canal主要用途是对mysql增量日志(binlog)解析,提供增量数据订阅和消费。
canal数据同步实现原理:
- Canal服务器端伪装成mysql从节点,订阅mysql主节点binlog日志
- 当mysql主节点binlog日志发生变化的时候,会通知给canal服务器端
- Canal服务器端接收到binlog增量数据日志,解析并转换成json格式输出到canal客户端
- Canal客户端接收到canal服务器端传递的增量数据日志后,异步写入到redis实现数据同步
优化建议:可以基于canal+kafka实现高效的异步数据同步,canal客户端接收到canal服务器端发送的增量数据日志后,异步将增量数据消息投递到kafka服务器端,再由kafka服务器端下游消费者订阅kafka主题,异步获取增量数据并同步到redis,大大提高大数据量数据同步场景下的数据同步效率。
文章来源地址https://www.toymoban.com/news/detail-559821.html文章来源:https://www.toymoban.com/news/detail-559821.html
到了这里,关于云事业群CTO线技术晋升考核机试题-分布式专题-D 分布式数据同步的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!