🎗️

中间件

Redis

redis设计与实现

16张图带你吃透Redis架构演进

redis cluster采用分布式hash计算处理节点

一致性Hash算法总结与应用

什么是缓存雪崩、击穿、穿透？

布隆过滤器
热更新
随机过期时间
分布式锁，拿到锁再修改数据库

分布式事务

如何设计一个秒杀系统？

前端后端限流
缓存（涉及缓存一致性问题）
消息队列（异步）
乐观锁而不是悲观锁
节流和防抖

数据库和缓存如何保证一致性？

如果选择更新而不是删除缓存则一定需要加分布式锁
先更新数据库再通过数据库日志异步删除缓存（业务解耦，不使用中间件而是单独的缓存服务，根据数据库日志构建缓存，维护热更新）
根据CAP理论，双写很难同时保持A和C，加入缓存意味着放弃C加强A，不适合强一致性系统
分布式事务也可以解决这个问题：https://dtm.pub/practice/theory.html，例如两段式或者三段式提交。如XA分布式事务

如何深刻理解Reactor和Proactor？

Redis系列文章——合集

限流算法之漏桶与令牌桶

分布式锁

常见问题

Mysql

Mysql 中 MyISAM 和 InnoDB 的区别有哪些？

mysql存储引擎实现

MyISAM的B+树索引叶子节点直接存储数据指针
InnoDB的B+树索引叶子节点存储主键，需要拿着主键再去查找

联合索引

联合索引的好处

导致索引失效的场景

对索引使用左或者左右模糊匹配（某些情况会被优化成走索引）
对索引使用函数
对索引进行表达式计算
对索引隐式类型转换
联合索引非最左匹配
WHERE 子句中的 OR

select默认属于快照读，通过MVCC实现，不会加锁，如需要加锁则需另加FOR UPDATE

InnoDB 存储引擎的默认事务隔离级别是「可重复读」

事务隔离级别和实现原理

隔离级别

notion image

单纯MVCC可实现可重复读

Mysql中行级锁依赖索引（因为是堆索引加锁，而不是数据），所以WHERE查询内容需要确保有索引

Mysql会对范围查询加间隙锁 ⇒ Gap Lock

行锁也称为Record Lock

Next-key Lock = Record Lock + Gap Lock，select * from where .. for update会加这个锁

Mysql默认为Row-Level Lock，也就是只锁住选中的记录，如果WHERE无索引则锁表

Mysql事务采取两阶段提交，begin并不意味着事务的开始，只有当显示增删查改时或者使用for update才会开始事务

Mysql索引分为主键索引和二级索引（普通索引），命中二级索引时也会对对应的主健索引加锁

Mysql乐观锁与悲观锁

MySQL 可重复读隔离级别，完全解决幻读了吗？

Mysql的可重复读依赖Read View, Read View是一个类似MVCC但是不完全相同的设计。导致了如下问题：

Mysql的事务在只有read-only queries时表现为可重复读事务级别
Mysql的事务在有write queries时表现为读已提交级别

对比Postgres和Mysql的事务隔离级别

undo log, redo log和bin log分别是什么？

Mysql慢查询优化

彻底搞懂MySQL的redo log，binlog，undo log

Tidb

NewSQL大神黄东旭：从0到1，如何设计一个分布式数据库

Percolator事务模型

Tidb in Action

Tikv

Tikv是行式存储，TiFlash是列式存储

Clickhouse

谈谈ClickHouse为何如此之快？

Databend

Databend 内幕大揭秘

minibend 从零开始打造查询引擎

minibend 第二弹：Data Source

Volcano Model

Morsel-Driven Parallelism

向量化执行

Presentations

论文清单

数仓和数据库的区别

新一代云原生数仓 Databend 架构与展望 | 3306π分享回顾

Leveldb

LSM树详解

Leveldb实现分析

Leveldb完全解析

保证顺序写, 不删除数据只追加

适用于写多读少 (SSTable一层一层往下找很慢)

内存中使用skiplist建立MemTable的索引

Compaction容易导致读放大, 写放大, WiscKey旨在解决写放大问题

组成部分

WAL

MemTable (Mutable vs Immutable), Leveldb只会维护最多一个MemTable, ImmutableMemTable

Tiered SSTable (compaction), 上层数据新, 下层数据旧

TableCache, BlockCache, BloomFilter

SSTable的索引文件, 存储每个key对应的offset

Segment, SSTable由很多小的有序的segment组成, compaction是对segment的多路归并

Rocksdb

HBase和Leveldb、Rocksdb有哪些异同

https://zhuanlan.zhihu.com/p/91146725

Etcd

Elasticsearch

Elasticsearch查询速度为什么这么快？

Kafka

Kafka为什么这么快?

顺序写入

零拷贝技术

partition分区, 支持横向扩展

page cache

kafka中Topic、Partition、Groups、Brokers概念辨析

Spark

HDFS

Hadoop、HDFS、Hive、Hbase之间的关系

Ceph

Arrow

Nginx

nginx默认支持consistent hash

nginx默认支持漏桶限流

nginx默认fork子进程而不是线程

多个进程共同监听socket