当前位置：首页 > 问答 > 正文

DB2里头怎么动手搭建database Partition，边做边学那种实操体验

钊智敏
问答
2026-01-01 13:24:22
1

规划与准备——我们想做成什么样？

想象一下,你有一个特别大的仓库（数据库），里面东西越来越多，一个货架（服务器）已经放不下了，存取速度变慢，你决定在旁边再搭几个一样的货架，把货物按照某种规则（比如按产品编号的尾号）分散到不同的货架上，这样，好几个工人可以同时在不同货架上干活，速度就快了。

在DB2里,这个“货架”就是一个数据库分区，每个分区有自己独立的内存、CPU和磁盘空间，我们今天的目标是：在一台物理机器上，模拟出两个分区，搭建一个分区数据库。

关键概念（边做边学1）： 分区是通过一个叫做节点组（Nodegroup） 的东西来管理的，节点组就是一组分区的集合，表被创建在某个节点组上，数据就会自动分布到组内的所有分区中。

实操准备：

登录系统： 用你的DB2实例所有者用户登录（比如常用的 db2inst1）。

准备目录： 我们创建两个目录来模拟两块独立的磁盘空间。

# 切换到实例用户，db2inst1
su - db2inst1
# 创建两个目录，代表两个分区的数据存放位置
mkdir -p /home/db2inst1/db2data/part0
mkdir -p /home/db2inst1/db2data/part1

记住这两个路径,等下会告诉DB2把不同分区的数据存到这里。

第二步：动手创建分区数据库

普通的数据库不是分区数据库,我们必须在一开始创建数据库的时候就指明它是一个分区数据库。

实操步骤： 在命令行下，输入以下命令来创建数据库，注意 ON 后面的路径，它指定了目录（catalog）分区的位置，也就是分区0（第一个分区）的数据存放地，我们把它指向刚才创建的 part0 目录。

db2 "CREATE DATABASE DPFDB ON /home/db2inst1/db2data/part0 ALIAS DPFDB USING CODESET UTF-8 TERRITORY US COLLATE USING SYSTEM"

边做边学2： 这个命令创建了一个名为 DPFDB 的数据库，关键点在于 ON /path/to/data，这指定了数据库的初始存储路径，在分区环境中，这个路径自动成为第一个分区（分区0）的路径。

DB2里头怎么动手搭建database Partition，边做边学那种实操体验

连接到这个新数据库：

db2 connect to DPFDB

第三步：定义分区（节点）和节点组

现在数据库有了,但它还只有一个分区，我们需要告诉DB2，我们还有第二个分区，并且把它们组成一个团队（节点组）。

实操步骤：

定义第二个分区（节点）： 我们需要更新数据库管理器配置，注册新的分区，这里会用到我们之前创建的第二个目录 part1。
```
db2 "UPDATE DBM CFG USING DFTDBPATH /home/db2inst1/db2data"
db2 "ADD DBPARTITIONNUM VERIFY WITHOUT PROMPTING"
```
第一条命令设置默认的数据库路径,第二条命令是一个必要的准备步骤。

添加第二个分区。DBPARTITIONNUM 是分区的编号，我们设为1（因为第一个是0）。HOSTNAME 就是本机，PORT 要选一个未被占用的端口号，比如50001。
```
db2 "ADD DBPARTITIONNUM 1 HOSTNAME localhost PORT 50001"
```
边做边学3： 这个命令等于在说：“嘿DB2，我还有一个分区，编号是1，它也在本机上，通过50001端口可以找到它。”
停止并重启实例： 让分区配置生效。
```
db2stop force
db2start
```
创建节点组： 重新连接数据库后，我们创建一个包含所有分区（0和1）的节点组。
```
db2 connect to DPFDB
db2 "CREATE NODEGROUP ALLNODES ON DBPARTITIONNUM (0, 1)"
```
边做边学4： CREATE NODEGROUP 创建了一个名为 ALLNODES 的“团队”，这个团队里有编号为0和1的两个“队员”（分区），以后创建在这个节点组上的表，其数据就会分布在这两个分区上。

第四步：创建分区表并观察数据分布

激动人心的时刻到了！我们要创建一张表，并看看数据是如何自动分家的。

实操步骤：

DB2里头怎么动手搭建database Partition，边做边学那种实操体验

创建表空间（可选但推荐）： 表空间是表的容器，我们先创建一个分布在 ALLNODES 节点组上的表空间。
```
db2 "CREATE TABLESPACE MYTBS IN NODEGROUP ALLNODES"
```
这步是为了更好地管理存储,你可以理解为在“团队”里划出一块公共区域来放桌子（表）。
创建分区表： 关键一步！创建表时，必须指定一个分布键（Distribution Key），DB2会根据这个键值的哈希（Hash）算法，决定每一行数据存放在哪个分区。
```
db2 "CREATE TABLE sales (
    order_id INT NOT NULL,
    customer_id INT,
    sales_amount DECIMAL(10,2)
) IN MYTBS
DISTRIBUTE BY HASH(customer_id)"
```
边做边学5： DISTRIBUTE BY HASH(customer_id) 是核心，它告诉DB2：“请根据 customer_id 这个字段的值来计算一个分布码，然后决定这条销售记录是放在0号分区还是1号分区。” 这样，相同客户的订单数据有很大概率会分布在同一个分区上，便于查询。

插入测试数据并验证：

# 插入几条数据
db2 "INSERT INTO sales VALUES (1, 100, 99.99), (2, 101, 150.50), (3, 100, 75.00), (4, 102, 200.00)"
# 我们来“窥探”一下数据到底存在了哪里
# 连接到分区0查看数据
db2 "SET CLIENT CONNECT_NODE 0"
db2 "CONNECT TO DPFDB"
db2 "SELECT * FROM sales"  # 你会看到一部分数据
# 再连接到分区1查看数据
db2 "TERMINATE"
db2 "SET CLIENT CONNECT_NODE 1"
db2 "CONNECT TO DPFDB"
db2 "SELECT * FROM sales"  # 你会看到另一部分数据

边做边学6： 通过 SET CLIENT CONNECT_NODE 命令，我们可以像“瞬移”一样，直接连接到指定的分区上去查看数据，你会发现，刚才插入的4条数据被大致均匀地分配到了两个分区中，这就是分区数据库的魔力！DB2在背后自动帮你做好了数据分片。