OceanBase集群管理日常运维操作

这篇具有很好参考价值的文章主要介绍了OceanBase集群管理日常运维操作。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

时钟同步

检查NTP时间是否同步,OceanBase能够容忍的集群内部时钟偏差最大为100ms

执行ntpq -q,输出的offset应该小于50ms

查看、启停、修改zone

启停zone实际上是在切换提供leader服务的zone,并不是真的在启停OS中的服务进程。

select * from __all_zone;
alter system {start|stop|force stop} zone [zone_name];
alter system {alter|change|modify} zone [zone_name] set [zone_option_list];

查看、管理observer

停止observer同样也不表示进程退出,仅表示不提供leader服务。

select * from __all_server;
select * from __all_server_event_history;
alter system {start|stop} server 'IP:port'[,'IP:port',...] [zone='zone'];

observer服务进程管理

查看observer进程

ps -ef | grep observer

启动进程(admin用户)

cd /home/admin/oceanbase
./bin/observer [启动参数]

停止进程

kill -15 `pgrep observer`
kill -9 `pgrep observer`

observer服务启动恢复

由于增删改数据在内存中进行,Observer进程启动后,需要:

  • 与其他副本同步,将clog或ssd基线数据进行同步(补齐);
  • 将上一次合并之后的内存数据恢复出来(clog回放),才能提供服务。

为了加快OceanBase的服务恢复过程,可以在停止observer服务之前,执行一次合并(major freeze)。

服务停止(停机运维)

  1. 如果停机维护时长大于1小时但小于1天,需要设置永久下线时间:
alter system set server_permanent_offline_time='86400s';
  1. 将服务从当前Observer迁走:
alter system stop server 'IP_address:2882';
  1. 检查主副本都已经切走,返回值为0:
select count(*) from __all_virtual_table t, __all_virtual_meta_table m
where t.table_id=m.table_id and role=1 and m.svr_ip='IP_address';
  1. 停止进程:
kill -15 <observer_pid>

服务恢复(停机运维结束)

  1. 机器上电;
  2. 检查机器ntp同步状态和服务运行情况;
  3. admin用户启动observer进程;
cd /home/admin/oceanbase
./bin/observer [启动参数]
  1. 系统租户登录,启动server:
alter system start server 'IP_address:2882';
  1. 检查__all_server表,查看status='active'start_service_time 不为Null,则表示observer正常启动并开始提供服务;
  2. 将永久下线时间改回默认值3600s
alter system set server_permanent_offline_time='3600s';

故障节点替换

为确保集群中有足够的冗余资源,需要及时对故障节点进行替换。

  1. 系统租户登录故障节点,停止observer,确保主副本都切走;
  2. 为目标zone添加新的server:
alter system add server 'IP_address:2882' zone 'zone1';
  1. 将故障server下线:
alter system delete server 'IP_address:2882' zone 'zone1';

OceanBase会自动将被下线observer上的unit迁移到新增的observer上。

  1. 检查__all_server表中的server状态,旧的observer的信息已经消失。

容量不足

内存不足

内存空间不足时,可以有以下两种处理思路:

  • 扩容:调大租户内存;
  • 释放已用内存:触发转储、合并。

存储不足

日志盘满时,根据日志类型处理:

  • observer运行日志:清理旧日志;
  • clog事务日志:查看__all_virtual_server_clog_stat,清理旧日志,再合并。

数据盘满时,可以扩容,将旧数据迁走,再合并。文章来源地址https://www.toymoban.com/news/detail-418771.html

到了这里,关于OceanBase集群管理日常运维操作的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 【运维】hadoop 集群安装(三)hdfs、yarn集群配置、nodemanager健康管理讲解

    上篇简单说明了多节点的hadoop节点怎么安装,但是没有细致的分析hadoop相关配置,具体怎么根据环境进行配置,接下来我们对这些配置进行讲解 Daemon Environment Variable NameNode HDFS_NAMENODE_OPTS DataNode HDFS_DATANODE_OPTS Secondary NameNode HDFS_SECONDARYNAMENODE_OPTS ResourceManager YARN_RESOURCEMANAGER_OP

    2024年02月10日
    浏览(41)
  • TiDB 应急运维脚本,更加方便的管理TiDB集群

    TiDB 应急运维脚本,更加方便的管理TiDB集群 使用方法 修改权限 使用示例

    2024年02月12日
    浏览(46)
  • Zookeeper集群写操作的具体流程和数据同步

    写操作:zk中向leader进行一个节点的写操作时,leader会向所有的Follower发送这个写操作,当Follower的写操作超过半数成功时会将成功的结果返回给leader。 数据同步:当写操作完成之后,zk集群会进行数据同步,leader将写操作完成的结果通知给所有的Follower节点,所有的Follwer节点

    2024年02月09日
    浏览(43)
  • Linux 系统日常运维 9 大技能,搞定 90% 日常运维

    一、Linux 系统日常运维九大技能 1、安装部署 方式:U盘,光盘和网络安装 其中网络安装已经成为了目前批量部署的首选方式:主要工具有Cobbler和PXE+kickstart 可以参考如下链接内容: http://www.cnblogs.com/mchina/p/centos-pxe-kickstart-auto-install-os.html 2、初始化配置 禁用服务 可以配置为

    2024年02月12日
    浏览(42)
  • 【Kubernetes运维篇】RBAC之创建集群用户管理K8S

    需求:公司新入职两位运维同事,分别是zhangsan、lisi,刚入职肯定不能给K8S管理员权限,所以需要创建两个系统账号,分别对应不同的权限: zhangsan用户 :对uat名称空间拥有管理员权限 lisi用户 :对所有命名空间拥有查看Pod的权限 第一步:生成一个私钥 第二步:生成一个证

    2024年02月16日
    浏览(50)
  • OceanBase集群技术架构

    本文章学习自OceanBase官方培训资料,仅供学习、交流 分区 当一个表很大的时候,可以水平拆分为若干个分区,每个分区包含表的若干行记录。根据行数据到分区的映射关系不同,分为hash分区,List分区(按列表),range分区(按范围)等 每一个分区,还可以用不同的维度再分

    2024年01月20日
    浏览(45)
  • OceanBase集群扩缩容

    ​ OceanBase 数据库采用 Shared-Nothing 架构,各个节点之间完全对等,每个节点都有自己的 SQL 引擎、存储引擎、事务引擎,天然支持多租户,租户间资源、数据隔离,集群运行的最小资源单元是Unit,每个租户在每个节点上只会运行一个Unit。 先看看集群整体架构图,下面集群的

    2024年01月21日
    浏览(42)
  • OceanBase集群部署

    我认为学习一个中间件比较好的方式是,先了解它的架构和运行原理,然后动手部署一遍,加深对它的了解,再使用它,最后进行总结和分享 本篇介绍OceanBase部署前提条件和集群部署 1.使用开源免费的社区版,企业版需要付费 社区版目前最新是V4.2.1_CE_BP3,它们之间的差异请

    2024年01月19日
    浏览(48)
  • 【zookeeper】zookeeper日常运维

    本文将分享一些zookeeper在日常使用中一些维护经验。 zookeeper长时间运行,快照逐渐增多可能造成服务器磁盘被占满的情况,但我们不能贸然用rm命令删除快照文件,如果直接删完会导致丢失好多数据,所以我们需要设置相关参数,并使用一些优雅的命令来删除文件,zookeeper自

    2024年02月09日
    浏览(38)
  • 基于DataX迁移MySQL到OceanBase集群

    📢📢📢📣📣📣 哈喽!大家好,我是【IT邦德】,江湖人称jeames007,10余年DBA及大数据工作经验 一位上进心十足的【大数据领域博主】!😜😜😜 中国DBA联盟(ACDU)成员,目前服务于工业互联网 擅长主流Oracle、MySQL、PG、高斯及Greenplum运维开发,备份恢复,安装迁移,性能优

    2024年03月18日
    浏览(40)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包