Oracle Server一台价值百万的服务器内存更换过程

这篇具有很好参考价值的文章主要介绍了Oracle Server一台价值百万的服务器内存更换过程。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

数据库代码敲多了,看乏了吧!

带各位DBA看看你们的数据库运行在什么样的硬件上。

1、故障现象

事发时2号位置报警

Oracle Server一台价值百万的服务器内存更换过程,系统集成,Oracle数据库记录,oracle,数据库,运维

登录ILO发现内存报警

Oracle Server一台价值百万的服务器内存更换过程,系统集成,Oracle数据库记录,oracle,数据库,运维

查看详细信息

Oracle Server一台价值百万的服务器内存更换过程,系统集成,Oracle数据库记录,oracle,数据库,运维

查看详细报警

Oracle Server一台价值百万的服务器内存更换过程,系统集成,Oracle数据库记录,oracle,数据库,运维

2、关于ORACLE 服务器DIMM 备用

默认情况下在 Oracle ILOM 中启用 DIMM 备用。由 DIMM 提供的物理地址空间由于性能原因而交错。在完全配置的服务器中,支持 16 向和 15 向交错。这意味着,如果您从中启动系统或 PDomain 的服务器上的其中一个 CMIOU 上存在不可用的 DIMM,则该 CPU 节点仍可提供 15 个 DIMM 的物理地址空间而不必降至 8 向交错,8 向交错仅提供 8 个 DIMM 的物理地址空间。

此外,为了最大限度地提高系统可用性,如果在系统运行时诊断出一个 DIMM 发生了故障,则内存会通过将故障 DIMM 的内容分配到其他 15 个 DIMM 来动态地从 16 向交错切换到 15 向交错。要启用这种重新分配,平台固件必须为一个 DIMM 的内容保留空间。结果,尽管将 DIMM 配置为 16 向交错,但是系统只能使用 15 个 DIMM 的物理地址空间。

DIMM 备用在各个 CPU 节点(即 CMIOU)上启用。因此,在完全装载的 SPARC M7-8 服务器(包含两个 PDomain)上,每个 PDomain 中最多可以有 4 个 DIMM 发生故障,服务器上总共可以有 8 个 DIMM 发生故障。对于具有一个 PDomain 的 SPARC M7-8 服务器,每个 DCU 中最多可以有 8 个 DIMM 发生故障,而对于 SPARC M7-16 多主机服务器,每个 DCU 中最多可以有 4 个 DIMM 发生故障,因此服务器上总共可以有 16 个 DIMM 发生故障。

注 -  DIMM 备用在完全填充的 CMIOU 上默认处于启用状态。DIMM 备用在半填充的 CMIOU 上未启用。如果系统在引导时或运行时必须取消配置某个 DIMM,则会将关联的故障视为不可维修故障,因此不会发出维修通知。所以,如果取消配置了某个 DIMM,则在另一个 DIMM 发生故障之前无需更换该 DIMM。如果系统必须在半填充的 CMIOU 上取消配置某个 DIMM,将会发出维修通知。

3、服务器关机下电

由于SPARC M7-8服务器CPU共线程数太多了,计算资源十分的充足,一般这种机器都做了虚拟化,solaris上一般叫ldom

我这里共2台物理主机,每1台上运行4个虚拟机,运行Oracle 12.2 的RAC。

先对虚拟机里的系统进行关机,再在物理机上查看虚拟机状态

root@solaris-up:~# ldm ls

NAME STATE FLAGS CONS VCPU MEMORY UTIL NORM UPTIME
primary active -n-cv- UART 16 64G 0.1% 0.1% 76d 21h 42m
ldm1 active -t---- 5000 320 896G 0.0% 0.0% 3m
ldm2 active -t---- 5001 224 448G 0.0% 0.0% 1m
ldm3 active -t---- 5002 192 384G 0.0% 0.0% 3m
ldm4 active -t---- 5003 80 210G 0.0% 0.0% 3m

执行命令关闭LDOM虚拟机

root@solaris-up:~# ldm stop ldm1 && ldm stop ldm2 && ldm stop ldm3 && ldm stop ldm4
Remote graceful shutdown or reboot capability is not available on ldm1
LDom ldm1 stopped
Remote graceful shutdown or reboot capability is not available on ldm2
LDom ldm2 stopped
Remote graceful shutdown or reboot capability is not available on ldm3
LDom ldm3 stopped
Remote graceful shutdown or reboot capability is not available on ldm4
LDom ldm4 stopped

确认状态都为bond。

root@solaris-up:~# ldm ls

NAME STATE FLAGS CONS VCPU MEMORY UTIL NORM UPTIME
primary active -n-cv- UART 16 64G 0.1% 0.1% 76d 21h 43m
ldm1 bound ------ 5000 320 896G
ldm2 bound ------ 5001 224 448G
ldm3 bound ------ 5002 192 384G
ldm4 bound ------ 5003 80 210G

准备关机更换内存

主机执行init0关机

登录到ILO管理系统里,关闭主机

-> stop /System

Are you sure you want to stop all of the configured hosts on the system (y/n) y
Stopping /System
stop:
/HOST0: Stopping
/HOST1: Stopping

4、拆下CMMIOU

根据之前的报警确认是CMMIOU2里的内存故障,这里可以在背面检查CMMIOU2的报警灯是否亮起,确认好位置

Oracle Server一台价值百万的服务器内存更换过程,系统集成,Oracle数据库记录,oracle,数据库,运维

按下图的方法拆下CMMIOU

Oracle Server一台价值百万的服务器内存更换过程,系统集成,Oracle数据库记录,oracle,数据库,运维

5、更换内存

找到、按下并按住 CMIOU 上的蓝色故障提醒按钮。

亮起的绿色故障提醒电源 LED 表示有电 可用于点亮有故障的 DIMM LED。任何有故障的 DIMM 都由 DIMM 插槽旁边的琥珀色 LED,直到您松开按钮。

确认主板上的内存位置和报错的位置一致,直接更换内存就行

Oracle Server一台价值百万的服务器内存更换过程,系统集成,Oracle数据库记录,oracle,数据库,运维

现场进行更换

Oracle Server一台价值百万的服务器内存更换过程,系统集成,Oracle数据库记录,oracle,数据库,运维

内存长这个样子,这一批用的时三星的DDR4内存条32G

Oracle Server一台价值百万的服务器内存更换过程,系统集成,Oracle数据库记录,oracle,数据库,运维

6、设备开机

-> start /System

Are you sure you want to start all of the configured hosts on the system (y/n)? y
Starting /System
start:
/HOST0: Starting
/HOST1: Starting

等待设备加电自检,时间会很长,一般在1小时-1.5小时左右。当然也可以取巧把检测都关了,试过最快15分钟开机。。。。

Oracle Server一台价值百万的服务器内存更换过程,系统集成,Oracle数据库记录,oracle,数据库,运维

最后打开虚拟机完成更换

怎么样,看完了是不是非常简单!!

参考

SPARC M8 and SPARC M7 Servers Administration Guide

SPARC M8 and SPARC M7 Servers Service Manual

Oracle® ILOM 配置和维护管理员指南

也欢迎关注我的公众号【徐sir的IT之路】,一起学习!

————————————————————————————
公众号:徐sir的IT之路
CSDN :徐sir(徐慧阳)-CSDN博客
墨天轮:徐sir的个人主页 - 墨天轮
PGFANS:PGFans问答社区:全球唯一的PostgreSQL中文技术交流社区

————————————————————————————

Oracle Server一台价值百万的服务器内存更换过程,系统集成,Oracle数据库记录,oracle,数据库,运维文章来源地址https://www.toymoban.com/news/detail-829242.html

到了这里,关于Oracle Server一台价值百万的服务器内存更换过程的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • nginx 如何实现一台服务器挂了访问另外一台服务器

    如果您想通过 Nginx 实现在 example1.com 服务器挂掉的情况下自动切换到 example2.com 服务器,可以使用 Nginx 的代理模块和负载均衡功能。 以下是一个示例的 Nginx 配置,实现了当 example1.com 服务器不可用时,自动切换到 example2.com 服务器: 在上述示例中: upstream 块定义了服务器组

    2024年02月12日
    浏览(60)
  • clickhouse如何将一台服务器上的数据导入到另一台服务器

    使用remote函数: 其中remote分别对应的参数: 参数1:ip+port,即为源数据的服务器ip+端口; 参数2:源数据服务器的数据库名; 参数3:源数据的表名; 参数4:源clickhouse数据库的客户端访问账号; 参数5:源clickhouse数据库的客户端访问密码;

    2024年02月15日
    浏览(53)
  • 网络编程: 服务器百万连接实现

    实验内容: 用三个客户端与服务器建立百万连接 服务器代码: Reactor 将实验遇到的问题记录如下 一个TCP连接叫做TCP控制块(tcp control block)。区分网络连接的五元组元素有 添加功能 增加服务器监听端口 如果服务器只用一个端口,那么至少需要10e6/(2^16-1024) ≈ 16台虚拟机。(能分

    2024年01月20日
    浏览(36)
  • 2.2.1服务器百万并发实现

    Reactor模型的几个重要组件:Event事件、Reactor反应堆、Demultiplex事件分发器、Evanthandler事件处理器 接上节课,上节课中,我们使用了epoll实现了同时监听多个文件描述符,是对IO的管理,也提到了reactor是对事件的管理,那具体来说是怎样的呢?reactor是事件驱动模型,也就是EP

    2023年04月23日
    浏览(37)
  • 如何将服务器数据迁移到另一台服务器?

    将服务器数据迁移到另一台服务器通常涉及以下几个步骤: 1.备份数据: 在进行数据迁移之前,首先需要备份服务器上的数据。这包括网站文件、数据库、配置文件等。可以使用各种备份工具和方法,如rsync、scp、FTP、数据库备份工具等。 2.目标服务器准备: 准备目标服务器

    2024年04月09日
    浏览(53)
  • 架设一台NFS服务器

    1、开放/nfs/shared目录,供所有用户查询资料   2、开放/nfs/upload目录,为192.168.xxx.0/24网段主机可以上传目录,   并将所有用户及所属的组映射为nfs-upload,其UID和GID均为210 3、将/home/tom目录仅共享给192.168.xxx.xxx这台主机,并只有用户tom可以完全访问该目录 服务端  客户端

    2024年01月19日
    浏览(33)
  • 为一台计算机配置Web服务器,DNS服务器与DHCP服务器

    实验目的:为一台计算机配置Web服务器,DNS服务器与DHCP服务器 事先准备:三台纯净虚拟机(以下简称为虚拟机A,虚拟机B,虚拟机C)和一台主机 一、配置静态IP 因为要保证实验畅通,所以必须把四台机器配置成同一网段,使用同一网卡 1、首先保证三台虚拟机的网络适配器

    2024年02月11日
    浏览(40)
  • 使用可上网的服务器作为网关,实现另一台服务器上网

    本文的目标是利用一台可以上网的服务器作为网关,使在同一局域网中的所有服务器都可以上网。 假设有若干台服务器:A,B,C,D… 其中服务器 A 可以上网 。 现在的需求是——我想让B,C,D也可以上网,具体来说有两种网线连接的方法。 如果不使用交换机,需要用网线将

    2024年02月08日
    浏览(34)
  • C++从0实现百万并发Reactor服务器

    C++从0实现百万并发Reactor服务器 // \\\"xia讠果URI\\\"》uкооu·ㄷㅁΜ C++从0实现百万并发Reactor服务器 - 网络编程基础 网络编程中有许多基础概念必须了解,比如 OSI,TCP/IP,字节序列等,这些都是开发网络应用的基础,可以帮助我们更好的理解网络程序的工作原理,来一起学习下一些

    2024年03月17日
    浏览(51)
  • 如何构建一台机器学习服务器

    系统安装这里就不再赘述,推荐使用ventory作为PE盘,来安装系统,这样方便快捷,可同时包含多个镜像,无需重复制作,需要注意的是在安装系统的时候需要手动进行分区,我们可以看一下我的分区结果: 在安装系统之后请先确认系统版本等内容和预想一致: 使用命令: 结

    2024年04月12日
    浏览(37)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包