ShardingSphere

tim-qtp...大约 3 分钟MySQL数据库分库分表

为什么要分库分表？

数据量庞大。
查询性能缓慢，之前可能是 20ms，后续随着数据量的增长，查询时间呈指数增长。
数据库连接不够。

什么是分库分表

分库和分表有两种模式，垂直和水平。分库两种模式：

垂直分库：电商数据库拆分为用户、订单、商品、交易等数据库。

水平分库：用户数据库，拆分为多个，比如User_DB_0 - x。

分表两种模式：

垂直分表：将数据库表按照业务维度进行拆分，将不常用的信息放到一个扩展表。
水平分表：将用户表水平拆分，展现形式就是 User_Table_0 - x。

不同场景

1. 什么场景分表？

单表的数据量过大。
单表存在较高的写入场景，可能引发行锁竞争。
当表中包含大量的 TEXT、LONGTEXT 或 BLOB 等大字段。

2. 什么场景分库？

当单个数据库支持的连接数已经不足以满足客户端需求。
数据量已经超过单个数据库实例的处理能力。

3. 什么场景分库分表？

高并发写入和海量数据

分库分表设计

1. 如何选择分片键？

数据均匀性：分片键应该保证数据的均匀分布在各个分片上，避免出现热点数据集中在某个分片上的情况。
业务关联性：分片键应该与业务关联紧密，这样可以避免跨分片查询和跨库事务的复杂性。
数据不可变：一旦选择了分片键，它应该是不可变的，不能随着业务的变化而频繁修改。

那用户名和用户ID选哪个作为分片键？

用户名。用户名可以登录。

2. 分库分表算法？

分库分表的算法会根据业务的不同而变化，所以并没有固定算法。在业界里用的比较多的有两种：

HashMod：通过对分片键进行哈希取模的分片算法。
时间范围：基于时间范围分片算法。

分片算法讲解一个数据均匀，时间范围并不适合优惠券模板业务，因为商家用户前期比较少，后面会越来越多，所以有比较明显的不均匀问题。*

引入 ShardingSphere-JDBC到项目

1、引入依赖

<dependency>
    <groupId>org.apache.shardingsphere</groupId>
    <artifactId>shardingsphere-jdbc-core</artifactId>
    <version>5.3.2</version>
</dependency>

2、定义分片规则

spring:
  datasource:
  	# ShardingSphere 对 Driver 自定义，实现分库分表等隐藏逻辑
    driver-class-name: org.apache.shardingsphere.driver.ShardingSphereDriver
    # ShardingSphere 配置文件路径
    url: jdbc:shardingsphere:classpath:shardingsphere-config.yaml

shardingsphere-config.yaml

# 数据源集合
dataSources:
  ds_0:
    dataSourceClassName: com.zaxxer.hikari.HikariDataSource
    driverClassName: com.mysql.cj.jdbc.Driver
    jdbcUrl: jdbc:mysql://127.0.0.1:3306/link?useUnicode=true&characterEncoding=UTF-8&rewriteBatchedStatements=true&allowMultiQueries=true&serverTimezone=Asia/Shanghai
    username: root
    password: root

rules:
  - !SHARDING
    tables:
      t_user:
        # 真实数据节点，比如数据库源以及数据库在数据库中真实存在的
        actualDataNodes: ds_0.t_user_${0..15}
        # 分表策略
        tableStrategy:
          # 用于单分片键的标准分片场景
          standard:
            # 分片键
            shardingColumn: username
            # 分片算法，对应 rules[0].shardingAlgorithms
            shardingAlgorithmName: user_table_hash_mod
    # 分片算法
    shardingAlgorithms:
      # 数据表分片算法
      user_table_hash_mod:
        # 根据分片键 Hash 分片
        type: HASH_MOD
        # 分片数量
        props:
          sharding-count: 16
# 展现逻辑 SQL & 真实 SQL
props:
  sql-show: true

ShardingSphere 数据分片核心概念

1、逻辑表

相同结构的水平拆分数据库（表）的逻辑名称，是 SQL 中表的逻辑标识。

2、真实表

在水平拆分的数据库中真实存在的物理表。

比如说：

逻辑表是t_user，应用程序中操作的表名，数据库中不是真实存在的，使应用认为只是与单一表交互。

真实表，t_user_0到t_user_15，是数据库真实存在的

ShardingSphere

# 为什么要分库分表？

# 什么是分库分表

# 不同场景

# 1. 什么场景分表？

# 2. 什么场景分库？

# 3. 什么场景分库分表？

# 分库分表设计

# 1. 如何选择分片键？

# 2. 分库分表算法？

# 引入 ShardingSphere-JDBC到项目

# ShardingSphere 数据分片核心概念