MySQL数据库工程师入门实战课程视频教程
4955 人在学
当执行写操作后,需要保证从缓存读取到的数据与数据库中持久化的数据是一致的,因此需要对缓存进行更新。
因为涉及到数据库和缓存两步操作,难以保证更新的原子性。
在设计更新策略时,我们需要考虑多个方面的问题:
更新缓存有两种方式:
更新缓存和更新数据库有两种顺序:
两两组合共有四种更新策略,现在我们逐一进行分析。
并发问题通常由于后开始的线程却先完成操作导致,我们把这种现象称为“抢跑”。下面我们逐一分析四种策略中“抢跑”带来的错误。
先更新数据库,再删除缓存
若数据库更新成功,删除缓存操作失败,则此后读到的都是缓存中过期的数据,造成不一致问题。
可能发生的并发错误:
先更新数据库,再更新缓存
同删除缓存策略一样,若数据库更新成功缓存更新失败则会造成数据不一致问题。
可能发生的并发错误:
当两个写线程发生冲突时,可以通过比较数据版本方式避免线程A写入旧的数据。
先删除缓存,再更新数据库
可能发生的并发错误:
先更新缓存,再更新数据库
若缓存更新成功数据库更新失败, 则此后读到的都是未持久化的数据。因为缓存中的数据是易失的,这种状态非常危险。
因为数据库因为键约束导致写入失败的可能性较高,所以这种策略风险较大。
可能发生的并发错误:
异步更新
双写更新的逻辑复杂,一致性问题较多。现在我们可以采用订阅数据库更新的方式来更新缓存。
阿里巴巴开源了MySQL数据库binlog的增量订阅和消费组件 - canal。
我们可以采用API服务器只写入数据库,而另一个线程订阅数据库 binlog 增量进行缓存更新的策略。关注java知音公众号,回复“面试题聚合”,送你一份面试题宝典
这种策略存在和先更新数据库后删除缓存类似的并发问题:
这个问题同样可以采用异步线程更新缓存,且写入缓存时比较数据版本的方法来解决。
这种数据集合具有如下特点:尽可能不重复,以最优方式为某个特定组织的多种应用服务,其数据结构独立于使用它的应用程序,对数据的增、删、改、查由统一软件进行管理和控制。从发展的历史看,数据库是数据管理的高级阶段,它是由文件管理系统发展起来的。