OB(下称OB)是一款分布式关系型数据库,具有高性能、高可用性和弹性扩展等特点,其企业版已经在公司内部的”去Oracle”项目中进行了落地,并取得了不错的效果。此外,考虑到我们仍有许多业务在关系型数据库上有着需求,同时考虑到我们已经具备MySQL/MariaDB/MongoDB/PostgresSQL在公司内部的K8S集群上进行容器化部署经验,因此我们决定将OceanBase也进行容器化部署。
在选择数据库时,我们从以下几个维度进行了分析:
在将OB部署到K8S的过程中,我们选择了 ob-operator 作为核心组件。ob-operator 提供了自动化管理 OB集群的能力,能够简化部署、扩展和运维的复杂性。其主要优势包括:
对于希望将 OB 接入 K8S 但不知如何下手的用户,ob-operator 提供了一个方便快捷的起点。
在开始之前,请确保已满足以下条件:
安装 cert-manager
# 检查是否已安装 cert-manager
kubectl get pod -n cert-manager
# 若未安装,则执行以下命令
wget https://github.com/jetstack/cert-manager/releases/download/v1.5.3/cert-manager.yaml
# 拉取镜像需要科学上网
# 我们使用的K8S的网络插件为OVN,节点需要调度到 OVN 网络的节点上,否则可能无法通过 cert-manager 的 service 访问后端 POD
kubectl apply -f cert-manager.yaml
安装ob-operator的操作可参考ob-operator部署,如果手动通过CRD部署可以自行从github仓库中下载CRD和Operator的yaml文件,然后通过kubectl apply -f 命令进行安装。
可参考官方文档进行集群创建
OBProxy(即odp,OceanBase Database Proxy) 是 OB集群 的代理组件,生产环境上建议使用 OBProxy 对OB集群进行访问。使用 OBProxy 的好处包括:
配置步骤
安装 OBProxy:直接应用 YAML 文件进行安装。
obproxy YAML文件地址:obproxy.yaml,但在部署 OBProxy 前需要创建一个用于 OBProxy 与 OB集群 通信的 Secret。
# 创建用于 OBProxy 与 OB集群 通信的 Secret
kubectl create secret -n oceanbase generic proxyro-password --from-literal=password='<proxyro_password>'
# 部署 OBProxy
kubectl apply -f obproxy.yaml
基本内容如下
# 相比官方提供的 obproxy.yaml 文件,增加了 odp-headless 的无头服务配置,主要目的是用于 coreDNS 进行域名解析
apiVersion: v1
kind: Service
metadata:
name: odp-headless
namespace: oceanbase
spec:
type: ClusterIP
clusterIP: None
selector:
app: odp
name: odp
ports:
- name: "sql"
port: 2883
targetPort: 2883
---
apiVersion: v1
kind: Service
metadata:
name: odp
namespace: oceanbase
spec:
type: ClusterIP
selector:
app: odp
name: odp
ports:
- name: "sql"
port: 2883
targetPort: 2883
- name: "prometheus"
port: 2884
targetPort: 2884
---
apiVersion: apps/v1
kind: Deployment
metadata:
name: odp # 生产环境下,不建议使用 odp 作为 Deployment 名称,建议使用 odp-${obcluster_name} 作为 Deployment 名称
namespace: oceanbase
spec:
selector:
matchLabels:
app: odp
name: odp # 生产环境下,不建议使用 odp 作为 Deployment 名称,建议使用 odp-${obcluster_name} 作为 Deployment 名称
replicas: 3
template:
metadata:
labels:
app: odp
name: odp
spec:
containers:
- name: obproxy
image: oceanbase/obproxy-ce:4.2.1.0-11
ports:
- containerPort: 2883
name: "sql"
- containerPort: 2884
name: "prometheus"
env:
- name: APP_NAME
value: helloworld # 用于 OBProxy 的名称
- name: OB_CLUSTER
value: obcluster # 此处填写OB集群的名称,其来源于 OB 部署YAML文件中的 clusterName 值
- name: RS_LIST
value: '******' # 格式为 ${OBServer1 POD_IP}:2881;${OBServer2 POD_IP}:2881;${OBServer3 POD_IP}:2881,需要根据实际OBSevrer PODIP来进行替换。
- name: PROXYRO_PASSWORD
valueFrom:
secretKeyRef:
name: proxyro-password # 用于 OBProxy 与 OB集群 通信的 Secret
key: password
resources:
limits:
memory: 2Gi
cpu: "1"
requests:
memory: 200Mi
cpu: 200m
部署完成后,如下图所示:
通过 OBProxy 访问OB集群:
此时,可以通过OBProxy的Service提供OB数据库的访问入口,如下(obmysql是我提前创建好的租户,testdb是提前在obmysql下创建的用户):
当然,在实际的生产中,我们采用的是域名访问的方式,而不是通过IP地址访问,因此需要进行域名重写,可看下一小节。
在我们的实践中,为了更好地管理 OBProxy 的访问,我们采用了 Headless Service 配合 CoreDNS 的方案:
clusterIP: None
设置,使得 DNS 查询可以直接返回后端 Pod 的 IP 地址。apiVersion: v1
kind: ConfigMap
metadata:
name: coredns
namespace: kube-system
data:
Corefile: |
.:3053 {
errors
log
health {
lameduck 10s
}
rewrite stop {
name regex ob-(.*).rds.com odp-headless-ob-{1}.oceanbase.svc.cluster.local
answer name odp-headless-ob-(.*).oceanbase.svc.cluster.local ob-{1}.rds.com
}
kubernetes cluster.local in-addr.arpa ip6.arpa {
pods insecure
fallthrough in-addr.arpa ip6.arpa
}
prometheus :9153
ready :8153
loop
reload
cache 10
loadbalance
}
ob-test.rds.com
)访问数据库,无需关心内部复杂的 K8S 域名。ob-*.rds.com
),便于管理和维护多个 OB 集群。ob-{clustername}.rds.com
访问数据库odp-headless-ob-{clustername}.oceanbase.svc.cluster.local
ob-{clustername}.rds.com
执行以下命令部署
kubectl apply -f prometheus.yaml
执行以下命令检查是否部署完成
kubectl get pod -n oceanbase | grep prometheus
执行以下命令获取SVC
kubectl get svc -n oceanbase | grep prometheus
如下
root@(datamars)mhpl74334-10.20.248.59 ~$ kubectl get svc -n oceanbase | grep pro
svc-prometheus NodePort 12.80.144.38 <none> 9090:30090/TCP 7d15h
因为我们本地已经有grafana,所以这里我们通过grafana的配置页面,添加prometheus数据源,然后通过prometheus的SVC地址进行接入。
Configuration
按钮,然后单击 Add data source
按钮。Add data source
页面,选择 Prometheus
作为数据源类型。Prometheus
页面,填写 Name
为 ob-prometheus
,URL
为 http://12.80.144.38:9090
(即上面的promethues对应的svc ip),然后单击 Save & Test
按钮。解决方案:
apiVersion: oceanbase.oceanbase.com/v1alpha1
kind: OBCluster
metadata:
name: test
namespace: oceanbase
spec:
observer:
image: oceanbase/oceanbase-cloud-native:4.2.3.1-101000032024061316
podFields:
schedulerName: custom-scheduler # 指定调度器为 custom-scheduler
resource:
cpu: 8
memory: 16Gi
...
问题描述:在使用 OVN 网络插件时,发现 Pod IP 在重启后发生变化,导致OBProxy无法正常访问OB集群。
解决方案: (1)使用ob-operator的service模式,即为每个OBServer Pod创建一个Service,通过service来做静态IP的绑定,从而解决IP变化的问题,用法如下:
apiVersion: oceanbase.oceanbase.com/v1alpha1
kind: OBCluster
metadata:
name: test
namespace: oceanbase
annotations:
"oceanbase.oceanbase.com/mode": "service" # 指定为service模式
spec:
observer:
image: oceanbase/oceanbase-cloud-native:4.2.3.1-101000032024061316
podFields:
schedulerName: custom-scheduler
resource:
cpu: 8
memory: 16Gi
...
但是链路上多一节service做静态IP的绑定,会增加网络的复杂度,而从生产角度和高可用shang因此我们采用了下面的方案。
(2)ob-operator更新到2.3.1,该版本支持OVN网络插件,并且能够做到Pod重建后IP不变。
(3)但仍存在潜在的IP冲突问题,即当一个 OB Pod 正在重建过程中时,如果此时有其他新的 Pod 被创建,这些新 Pod 可能会占用到正在重建的 OB Pod 原本使用的 IP 地址。这会导致该 OB Pod 重建完成后无法使用其原有的 IP 地址。
为了解决这个问题,我们采用了 OVN 的子网隔离方案:
apiVersion: kubeovn.io/v1
kind: Subnet
metadata:
name: ob-subnet
spec:
protocol: IPv4
cidrBlock: 10.16.0.0/16 # 为 OB 集群预留足够大的网段
namespaces:
- oceanbase # 将子网与 oceanbase 命名空间绑定
gateway: 10.16.0.1
excludeIps:
- 10.16.0.1..10.16.0.10 # 排除网关等保留地址
这种配置的优势: