澳门新浦京娱乐场网站-www.146.net-新浦京娱乐场官网
做最好的网站

Linux下的高可用性方案研究,如何在服务器在线模

万般痛的会心:10三起惨痛宕机案例,理解十3起案例

社区有无数兄弟分享惨痛宕机案例,提示大家需小心,以下介绍几起,满满都是血的教训……

(以下案例来自社区多位会员分享,首要由社区专家孙伟光、崔增顺编辑整理)

**

01

AIX 下 NTP 设置不当产生的多少个集群宕机

作业产生在一段时间以前,接到朋友电话,用户有3套 oracle rac 集群运维在 aix 小机上,本地两套,同城机房两套,做完设备搬迁后的一天夜里,当中地点和同城的两套 rac 突然就全数重启了,而且发生在同样时间点。

网络、小机、存款和储蓄、数据库分属不一样的维保厂家,那就初叶了口角。各家就早先从友好的趋向自证无过错。作者去从前内心也正如赞同于 oracle 的网络心跳出了难点,crs 抢 vote disk 的时候接触了重启。但由于是小机方的代表,仅从 aix 层面做了排查,未开掘鲜明原因。对各主机宕机的日子做了贰个梳理,去和 oracle 的事件日志去比对。一时没查到怎么样事物。

宕机发生的 dump 发到了 IBM 原厂,IBM 后来出了个报告,依据 dump 内容稳固触发宕机的进度为 cssd。oracle dba 重视看了要命进程的日记,开掘宕机时间前后,时间突然改造,提前了40多秒。dba 确认,时间转移过多,cssd 进度会导致系统重启,猜疑和时间一齐有关。

经济检察查,三套 aix 的 rac 集群使用了同2个 ntp server,但有1套没发出难点。比较检查差距,开掘没难题的那套主机集群使用 xntpd 形式配置了时光一齐。出题指标主机则一贯动用了 ntpdate 命令做时间更新,并写入了 crontab 定期实施。检查 /var/adm/cron/log 日志,开掘按期职分的实施时间和 cssd 故障时间一致。检查时间服务器,开掘搬迁后,时间服务器的时刻发出了异常的大偏差,xntpd 形式的时日一同在时间不是大时不会去强制同步,ntpdate 命令的点子未有这一个限制,会直接举行联合。最后产生了 cssd 进度检查测试到过大日子不是后触发了宕机。

**经验分享:安排时间共同时,提议选拔 xntpd 服务的办法,**不用直白在定时职责里写 ntpdate,因为 ntpdate 极粗大暴,爆发故障时一点都不小的年月不是会招致应用出现难点,触发无法预言的后果。

由社区会员王巧雷分享

02

利用爱数备份壹体机导致宕机

二零一八年我们恰好动手了壹台爱数备份①体机,在测试阶段境遇了多少个小例子和豪门分享一下:

眼看测试各个数据的备份和效益,就在一台系统上安装了爱数备份的代理客户端,客户端安装选项中有一项安装 CDP 驱动。 当时并不曾留神,后来调升客户端版本,其余做了部分别样测试,就把代理客户端卸载了,然则并不曾先去卸载 CDP 驱动,重启后系统就平昔起不来了,和爱数的技巧扶助调换后理解,急需先卸载CDP驱动,再卸载客户端,不然CDP 驱动存在的时候,就能导致系统运营退步。

由社区会员“pysx050三”分享

03

经文双机双积攒,某晚主存储格外故障,业务马上刹车

用户出色的双机双存款和储蓄高可用应用方案。IBM 二*P570 PowerHA陆.一两新北端存款和储蓄通过 lvm mirror 完结的数目镜像,上边跑着用户信用贷款系统,报表系统,存储压力相比较繁忙。用户每年都会成功一次HA 切换演习保障工作高可用。某晚二回存款和储蓄电源故障,电源还没出示急更动,别的3个电源也坏了。这样主存款和储蓄宕机了。恰巧那一年职业也当即终止了,用户电话里说刚做完的 Powerha 的排练,很顺遂。可前天发出的那事却百思不得其解。

新兴由此大批量的日记和与用户调换得知,用户从前的1个操作给此番的事务暂停埋下了多少个大大的”地雷”。

终究用户自个儿做的怎么着操作形成的此番风云呢?

用户业务系统有3个文件系统存款和储蓄空间不够了,要求扩大体积,不过当前共享 vg 里的上空不能够满了,供给重新加新的磁盘到 vg 里,存款和储蓄管理员分配新的磁盘给两台主机,然后用户通过 Powerha cspoc 去加盘,扩大体量 FS。就是这么二个操作变成的难点发出。

经历分享:lvm mirror 双存款和储蓄的情景下,大家扩 fs 供给专注先扩 LV,再扩 fs,那样能保险数据正确布满在二个存款和储蓄上,如若在用户那种现象新加磁盘后间接扩fs,那就能够促成数据拷贝是二份,可是不能够标准地保管分布在多个存款和储蓄上,有望存款和储蓄A布满9/10存款和储蓄B分布1百分之10。那样一台存款和储蓄故障,就能一向导致数据的不完整。

由社区会员孙伟光分享

04

HACMP NODE ID 一致导致故障宕机

故障描述:

前几天在论坛闲逛,发现一兄弟的帖子“Power HA 在那之中一台至极宕机”(发表者:yangming二柒),点进入1看,开采故障描述和报错音讯和自身前面遭遇的一模二样,依据提醒和血的教训,特将该难点编写成案例,希望大家引认为鉴!

咱俩生产条件有 PowerVM 虚拟化后的 AIX 虚拟机二台,灾备境况有 PowerVM 虚拟化后 AIX 虚拟机一台,叁台虚拟机通过 PowerHA XD(基于 SVC PPLacrosseC 远程复制)搭建了跨中央高可用蒙受,操作系统版本为七.1.2.三,HA 版本为7.一.2.6,搭建该条件以前,生产境况的两台 AIX 是通过 HAMCP 搭建了地方的高可用景况,为了灾备建设须求,将地方的一台主机通过 alt_disk_copy 的措施复制了一份 rootvg 至外置存款和储蓄,并将该外置存款和储蓄通过 SVC PP锐界C 复制至灾备存款和储蓄卷当中,灾备的虚拟机再挂载该卷,并因此该卷运转操作系统。那样③台 AIX 虚拟机再另行搭建了PowerHA XD,完成跨中央 HA 热备。

经过那种方法,我们搭建了3套系统,均经过了 HA 切换测试,不过运营了一段时间后,在这之中壹套系统的主机故障宕机(关机),财富组切向了备机,开采难点后,第临时间查看 errpt 日志,如下(这里借用 yangming二柒帖子中的日志截图)

故障分析:

出于操作系统未有开 always allow dump,所以并不曾生出 dump 文件,当时分析了很久日志,相当狐疑不解,最后只可以交给给 IBM 后台进行辨析,后台也是成都百货上千天都未曾答复。过了四个礼拜后,第一套系统也油然则生了千篇一律的情况,同样的故障,产生主备 HA 切换,小编起来不敢相信 无法相信是 HACMP XD 实践难题,立马翻阅了须臾间实行文书档案,开采在做 alt_disk_copy 时只用了 alt_disk_copy -d hdiskx,前边并不曾用-O -B -C参数,这一个参数重借使用来复制rootvg时,删除原操作系统的铺排音讯和 ODM 库的部分音信,那样一来大概就能招致生产主机和灾备备机的操作系统有些音信同样。基于这种疑虑,作者复看了 errpt 报错记录,宕机的要紧缘由应该是以下多少个点:

IBM.StorageRM daemon has been stopped

Group Services daemon stopped

Group Services detected a failure

QUORUM LOST,VOLUME GROUP GROUP CLOSING

疑惑是还是不是是 QUORUM 中保存的八个主备节点音信一样,导致 QUORUM 关闭。

随即在生养主机运行命令

odmget -q "attribute='node_uuid'" CuAt

输出:CuAt: name = "cluster0" attribute = "node_uuid" value = "673018b0-7a70-11e5-91fa-f9fe9b9bc3c6" type = "R" generic = "DU" rep = "s" nls_index = 3

在灾备主机械运输营命令 odmget -q "attribute='node_uuid'" CuAt

输出:CuAt: name = "cluster0" attribute = "node_uuid" value = "67301842-7a70-11e5-91fa-f9fe9b9bc3c6" type = "R" generic = "DU" rep = "s" nls_index = 3

生育主机运维命令

/usr/sbin/rsct/bin/lsnodeid

灾备主机械运输维命令

/usr/sbin/rsct/bin/lsnodeid

如上发现三个节点的 RubiconSCT NODE ID 完全一致

那就是致使消和解持的点,变成了主服务结束和 QUORUM 仲裁关闭的罪魁。

故障消除:

壹.将 PowerHA XD 的 HA 服务整个关闭,禁止 HA 组服务的保证,并运转命令

/usr/sbin/rsct/bin/hags_stopdms -s cthags

/usr/sbin/rsct/bin/hags_disable_client_kill -s cthags

2.停止 HA 的 ConfigRM 服务和 cthags 服务

stopsrc -s IBM.ConfigRM stopsrc -s cthags

三.重新配置 酷路泽SCT 节点

/usr/sbin/rsct/install/bin/recfgct

4.重启全数叁台操作系统

shutdown -Fr

5.开发银行 HACMP 服务和能源组,并检查 途乐SCT NODE ID

经验分享:因此以上办法,深透消除了3套系统的 HACMP 主机宕机难题,提议之后做类似 alt_disk_copy 时,一定要带上-B -C -O参数,保持新操作系统的洁净,幸免际遇类似的莫明其妙的标题。

由社区会员“jxnxsdengyu”分享

05

Power 570/595 宕机

思想政治工作起因:

鉴于机械宕机是在礼拜伍,是客户的主导应用,但周六客户未有人上班,当周一上班的时候开采装有的办公室,邮件系统等二分一的主旨应用不能访问,经过实地机房管理人士的一时半刻排查,开采小机 Power5玖5 后边全数的 I/O 柜掉电,Power570 黄灯亮起,绿灯慢闪。

技术员达到现场,遵照与客户沟通好结果,我们开始职业,大致折腾了五个时辰,Power595照旧不曾运行起来,但 power570 能够常常访问了。为了尽快让客户生产数据,大家权且决定,用 power570 一时半刻做个 lpar 让存储链接过来,先拉起应用,再又煎熬了3个多钟头过后,全数应用都能够寻常访问。大家后续排查Power5九5,大家转移了 CEC DCA 内部存款和储蓄器板,CPU 都未有消除难题,最后改换了 pubook 难题解决了,成本时间三天。

标题由来:

电工资制度改进造线路,变成了机房断电,UPS 一时接管,由于电池放了太久,机器功率太大,变成低电压运营,变成设备不能健康办事,更为重要的是电工现身难点现在并未有当即检查电路,基于师傅的陈述大约过了一分钟又把调换电送出去,这一个电压冲击是非常的棒的,经排查此电工无证施工,客户已经聊到诉讼。

由社区会员“shizhe十30”分享

06

ERP 备份导致的一齐宕机案例

情景回看:

某日凌晨,个中一台 ERP 数据库主机宕机。AIX.伍.叁 HACMP RAC 数据库景况。

故障分析:

宕机时间点是在备份时期。通过分析数据库日志、系统日志、发掘形成数据库停库的重中之重缘由是出于 HACMP 的2个护理进度 haemd 发生自动重启,由于 oracle 数据库和 haemd 进度之间关于联,因而数据库在开采 haemd 重新启航后也自动结束。

经 IBM 程序猿及实验室分析,Haemd 自动重新启航的案由是由于在认按期期内(参数为2秒钟)未有给 HACMP 系统响应,其原因之一是由于系统过于繁忙,未有响应 Haemd。

继之分析结果开采在备份时期,从存款和储蓄看系统不是很费劲;但 ERP 数据库服务器主机品质相当:有时会晤世阶段性的不响应现象,同时系统 I/O 高。停止备份后,那种地方不复存在。

经 IBM 实验室帮忙,初阶经过分析:

一)AIX 系统内部存款和储蓄器分为计算类和非总括类内部存款和储蓄器。非计算类内部存款和储蓄器首要用于文书操作CACHE,以便狠抓文书再次读写的属性。如今ERP 生产数据库占用了近20G内部存款和储蓄器作为文件系统 CACHE。

二)当文件系统 CACHE 有空间时,写文件操作将不会爆发鸿沟,当文件系统 CACHE 无空间时,系统将会依靠当中政策,挤出一些 CACHE。当不能够找到空闲的 CACHE 时,会等待系统调动出空闲的 CACHE。当出现多量等候时,系统可能出现无响应的情状。

减轻方案:

设想到现在数据量的充实,借使无法减轻异常的大 I/O 对系统的影响过大的主题材料,那些隐患将直接留存。

调动该备份文件系统的属性,在该文件系统的 I/O 请求到达一定值的状态下,阻塞对该文件系统的读写 I/O,从而确认保证预留丰富的能源给系统。具体参数为 Maxpout、Minpout。

经历分享:马克斯pout、Minpout 参数的选料,是和求实条件相关的,没有1个联合的建议值。若该参数设置不客观,只怕会影响到文件系统的读写操作。而适用的参数需求经过设置、阅览来规定。

由社区会员孙伟光分享

07

weblogic 宕机难点排查

主题材料现象:

系统相连续运输作二-3天,中间件出现宕机

系统运营时期只要访问 weblogic 调控台,操作一遍后中间件宕机

报错日志:

分析:

透过报错日志分析,为内部存款和储蓄器溢出,且为非堆内存溢出,那种状态相似供给调动:PermSize 的高低。

解决进度:

调动 weblogic 配置参数:setDomainEnv.sh 设置 setDomainEnv.sh 为512。

调解后重启系统,开采标题照旧,并从未缓慢解决宕机难点。

显著修改参数是或不是见效:生成 javacore 来分析(kill -3 进度ID)截图如下:

咱俩发掘参数并未卓有功能。继续分析参数为啥未有生效。

Weblogic 中的 commEnv.sh ,发现 JAVA_VENDOR 为 N/A

而 setDomainEnv.sh 中 PermSize 的装置为:

这里的参数并未 设置大家供给的 Open JDK的 JAVA_VENDO哈弗 的 N/A 的赋值,所以非堆内部存款和储蓄器的装置未有生效。

注意:正常 open jdk 的 JAVA_VENDO奥迪Q5 为 Oracle 的,然则配置文件却为:N/A,或然是 weblogic 的包容性难题,大概人工退换导致,找到原因了,那么些主题素材就不曾细究。

赶尽杀绝方案:

修改 commEnv.sh , JAVA_VENDO凯雷德 为 Oracle、HP、IBM、Apple 中的任何一个

在 startWeblogic 中,单独定义:MEM_ARGS="-Xms2048m -Xmx2048m -XX:PermSize=1024m"

评释方案:

行使第二种方案:

壹)在原本暗中认可意况,进行13个时辰的循环操作,并频频访问 weblogic 调节台。

贰)在改动后的条件,持续访问 weblogic 调整台,生成 javacore 文件看参数是或不是见效。并展开伍拾人高强度的出现测试贰拾2个钟头,看是还是不是会重现宕机难点。

在方案的率先步,系统运作贰小时,访问调节台,中间件宕机,系统无法访问。

在方案的第一步,系统在53人高强度的产出测试20钟头的情状下,响应符合规律。频仍造访调控台并未有开采任何尤其。通过转移 javacore 开采非堆内部存款和储蓄器平常生效。

由社区会员“gu y 01壹”分享

08

P550/P570 宕机案例

某周末,客户致电,说基本业务不可能访问。程序猿达到现场,开采客户境况(P550/P570--HACMP)P550 两台小机均关机。开掘客户现场有局地服务器也已处于关机掉电状态。此时客户才发掘,市电礼拜陆夜间断电过,可是客户机房配备有二台 UPS,机房设备十分之五二分之一分别接收二台 UPS上。排查开采里头1台 UPS相当的小概供电。而两台小机均有联袂电源接到该 UPS,导致市电断电后,直接宕机。

后将小机通电开机,开采P550不能开机,CPU V奥迪Q伍M 稳压模块报错,由于客户业务较为关键,将 P570 已经拉起来,计划将 HA 集群在 IBM P570 单节点运行。却发现 HA 无法将 Oracle 数据库拉起。由于时日火急,手动在 P570 网卡上增添 IP 小名后,手动挂载 VG,恢复生机职业。

继承,将 P550 稳压模块进行调换后,发掘依旧不能开机,又出现新的报错:11002630,再一次转移 CPU 板后,P550 小机平常开机。布置停机窗口实行排查苏醒。在管理进度中,集群出现意外,在 HA 拉起来后,经业务测试,发掘/orafile丢失一部分数量,此时备份数据最新的为前1天夜晚二三点,单天的数据未做备份,只可以选取数据恢复生机,最终成功将数据复苏回来。重新配置 HA,模拟故障切换,测试工作,验证数据完整性,业务恢复生机平常!

由社区会员“AC丹特”分享

09

AIX6100-06-06系统 bug 引起 down 机

某机器操作系统版本六100-0陆-0陆,系统 down 机,生成 dump 文件。

Problem:

System crash with following stack

CRASH INFORMATION:

CPU 3 CSA F00000002FF47600 at time of crash, error code

for

LEDs: 30000000

pvthread 02BD00 STACK:

[00009500].simple_lock 000000 ()

[00450E24]netinfo_unixdomnlist 000824 (??, ??, ??, ??,

??, ??)

[0451214C]netinfo 00006C (??, ??, ??, ??, ??, ??)

[004504DC]netinfo 0000FC (??, ??, ??, ??)

[00003850]ovlya_addr_sc_flih_main 000130 ()

[kdb_get_virtual_memory] no real storage @

FFFFFFFFFFFEF20

[100002640]0000000100002640 ()

[kdb_read_mem] no real storage @ FFFFFFFFFFF5E30

bug原因:

File lock is taken before checking whether the file type is socket.

该故障因 netstat -f unix 命令引起系统 crash, 是 IBM bug 引起

提出单独升高 bos.mp64包补丁包可能完全提高到陆100-06-1二-133玖(SP1二)

官方网站解释:

IV09793: SYSTEM CRASH IN NETINFO_UNIXDOMNLIST APPLIES TO AIX 6100-06

File lock is taken before checking whether the file type is socket.

由社区会员“qb30陆”分享

10

P570 宕机案例

IBM 570 意外宕机,管理进程如下:

1、首先查看 asmi 日志,电源清劲风扇故障,退换了3个电源和1个电风扇后,能够运行到 standby 情势。不过丰裕多的 firmware 报错。

二、进级微码到 sf240-417后,微码报错消失。

3、激活分区失利,hmc 终端会出现几秒的”ide inited failed“提醒,然后消失。接着卡死,报找不到硬盘。

肆、观看外观,开掘后端的光导纤维卡灯尤其弱,有时会不亮。

5、查了下570的红皮书结构图,开采 ide controller(红线圈住部分)同时管理pci 设备和硬盘背板设备过来的 io,依据现存故障现象,推断 ide controller 有故障。

6、通过 ibm system information center,定位到 ide controller 的 location code 为p一-1伍,不是1个可替换的 FRU,必须会同 IO backbone(便是主板)一同改变。

柒、改变 io backbone 后,系统健康运行,进入系统微调后,一切平日。

由社区会员王巧雷分享

11

某集团 HACMP 软件,在网络沟通机改变时引起 down 机

某集团 HA cluster log, IP switch down 时引起双节点 halt,系统版本7十0-0三-03,HA 版本陆.一sp一叁

Error description

In HACMP 6 with rsct.core.utils 3.1.4.9 or higher, if all

IP networks are lost and at least one non-IP network is

functioning, the Group Services subsystem will core dump when

trying to send packets to be routed through Topology Services

(across the non-IP connection). This will cause a node halt.

Customers with PowerHA 7, or HACMP 6 customers with no non-IP

networks (such as rs232 or disk) are not in danger. Also this

will not happen if only one node is still running, since there

will be no other cluster members to send messages to.

日志如下:

缘由是补丁 IV552玖三: HAGSD CORE DUMP WHEN IP NETWOMuranoKS LOST, 必要进步rsct 文件集。

官方网站解释:

由社区会员“qb30陆”分享

12

巡检不细致 Power5九伍 宕机

事件缘起,本来巡检已经意识个中的1个 I/O 柜电源故障,在线退换走脚步的时候,脚步试行到陆分之三挑起该 I/O 柜突然掉电,重启了该 I/O 柜。

原因:壹线工程师巡检时候不够细致,因为该同三个 I/O 其实坏了1个电源,只可是其它3个尚未报出来具体的地方,但已经报出来该 I/O 的构件号,但也注明了 IBM 小机未有完全报错具体槽位,只报错了大意上的职位。

消除措施:设备下电,退换七个 I/O DCA,然后设备开机,难题消除。

由社区会员“shizhe十30”分享

13

X86 史上最不可信赖的宕机事件

硬件: IBM的X3650 操作系统: suse 玖

linux 系统无法远程登入,用 KVM 登录上去看开掘定在操作系统页面无法动。

重启操作系统后,在操作系统 message 日志里面查看到如下错误:

透过咨询 novell 和 IBM 工程师,结论是 IBM 那类服务器在装 linux 系统的时候,若是光驱有标题确实是会导致宕机。

经硬件程序猿检查,是光驱坏了……坏了……

编者按:宕机原因千万种,那个宕机有点冤

由社区会员“hp_hp”分享

正文转发自公众号: talkwithtrend

越多相关小说阅读

1个运营怎样从底层走上人生巅峰

运行无间:阿里Baba(Alibaba)运转有限支撑类别的1种极品实践

芳华永在!一个老运营的20年奋斗史

饿了么异地双活数据库实战

Python 编制程序中常用的1二种基础知识总结

青铜到王者,火速进步你 MySQL 数据库的段位!

有赞数据库自动化运营实行之路

运转版《曼彻斯特》,听哭了有点人...

平等会 Python,他的工薪比你高1倍

Ali万亿交易量级下的秒级监察和控制

IT 运转的救赎——顺丰运行的美好践行

学好 Python、拿高薪、竟是如此轻易

快到场高维大学直通车成为证实运转开荒程序猿

只需要5天!

在5天内聚焦向你传授面向 DevOps 的运转开荒程序猿所急需调控的全数经典。

更有含金量的是,学习甘休你还将具有一张【运行开采技术员认证证书】

那份含金量超高的证书:

如能被推举进入上述大厂,您的培养和练习费将被退后50%!!

愈多厂家直通车,正在路上。

也接待公司和大家关系:

刘琳,微信/电话:13910952502

参与表达运营开垦工程师学科报名、实际情况请点击阅读最初的作品链接

服务器才具已经进步几十年,但随着网络音信技巧的开垦进取。云手艺和活动平台成为新的技巧标准。为了使终端更方便人民群众,客户端会采纳手持式移动装备和浏览器,并须要相关的数额和程序须保留在“云”端。随着云技能和移动平台的发展,服务器的多寡和规模一定成几何级数的滋长。故障和主题材料也会成倍增加。但和在个体运用的情况例外,互联网化的服务器由于同时扶助广大的操小编。运维不相同的网络应用程序。管理众多的地头和长距离设备。其配备的故障会诊就相对复杂。

内容简单介绍

壹    DSG在国内的基本点使用客户

  保证持续安定的种类运转时刻变得愈加首要,而古板意义上的小型计算机系统让普通用户望而却步。用户须求的是越来越高的可用性以及更低的基金。高可用性(HA)本事能自动质量评定服务器节点和劳动进度错误、失效,并且当发生那种景观时能够自行适本地重新配置系统,使得集群中的别的节点可以自动承担那一个劳动,以落到实处服务不间歇。 Cluster应用可分为三地方:High-Availability(HA)(高可用性集群)、Load Balance(负载均衡集群)、Scientific(科学集群)。在集群的这两种为主项目之间,常常会生出混合与交杂。于是,能够开掘高可用性集群也足以在其节点之间人均用户负载,同时仍试图保持高可用性程度。同样,能够从要编入应用程序的集群中找到叁个相互集合,它能够在节点之间进行负载均衡。而本文则重申于介绍基于Linux的HA化解方案方面包车型地铁标题。 基于LVS的HA方案 Linux要进入高等集镇就务须在那上面有相应的艺术,所以众多厂家都在那上头加大了研讨力度。未来,大家得以选择一些留存的软件去构筑具备高可用性的LVS系统。下边列出三种方案,以供参考。 [方案1]mon heartbeat fake coda 大家能够利用“mon”、“heart beat”、“fake”和“coda”多少个软件来修建具有高可用性的Virtual Server(虚拟服务器)。“mon”是叁个大众化的能源管理类别,用来监督网络上的服务器节点和网络服务。“heartbeat”达成在两台微型Computer间通过在串行线上选择UDP协议传送“心跳音讯”。“Fake”是三个应用ARP期骗的格局来促成IP接管。 当服务器故障时,管理进度如下:“mon”进度运转在负载均衡器上,肩负监测整个集群的服务器节点和服务进度。在布局文件“fping.monitor”中写入要检验服务器节点,然后“mon”进度将会隔t秒检查一下相应的服务器节点是还是不是还活着。 此外相关的服务监视器也要做相应的布置,那样“mon”进度将每m秒检验一下具备节点的呼应服务进程。例如:http.monitor:用于配置监察和控制http服务;ftp.monitor:用于配置监察和控制ftp服务;依此类推。当配置达成后,某些服务器节点失效或重新生效、服务进程失效或重复生效时都会发送一个通报音信,因而,负载均衡器能够清楚服务器节点是或不是能接受劳动。 今后,负载均衡器成为了整个体系的单点失效。为了堤防本场景,大家不可能不设置多个载重均衡器的备份服务器。“fake”软件达成当负载均衡器失效时,备份服务器自动接管IP地址,并持续服务。而“heartbeat”则随时依据负荷均衡器的动静自动激活/关闭备份服务器上的“fake”进程。在负载均衡器和备份服务器上都运维着贰个“heartbeat”进度,它们经过串行线周期性地发送“I'm alive ”音讯。假诺备份服务器在贰个预约时间内收纳不到来自负载均衡器的“I'm alive”消息时,将自动激活“fake”进度接管负载均衡器的IP地址,并开头提供负载均衡服务;而当再一次接到来自负载均衡器的“I'm alive ”新闻时,备份服务器将活动将“fake”进程关闭,释放出它接管的服务器,负载均衡注重新起头事业。 然而,假如负载均衡器在客户正在呼吁时失效,那时会唤起客户请求失败,客户必须重新发出请求消息。 “coda”是叁个容错的布满式文件系统,源于Andrew文件系统。服务器上的目录能够存款和储蓄在“coda”上,所以文件能够落到实处高可用性,并且易于管理。 [方案贰]ldirectord heartbeat “ldirectord”(Linux Director Daemon)是JacobRief编制程序达成的一个单独进度,以达成对劳动和情理服务器的监测,广泛地用来http和https服务。 “ldirectord”安装简便,能很好地与“heartbeat”合营工作。“ldirectord”程序包涵在“ipvs”包中的“contrib”目录中。 以下是“ldirectord”的一部分亮点: “ldirectord”是特别创作的LVS监测程序。 它从/etc/ha.d/xxx.cf文件中读取全数有关IPVS路由表的布局音信。当“ldirectord”运转起来后,IPVS路由表将会被恰本地布局。 可以将Virtual service配置放在多少个布局文件中,所以可以单独修改某1种服务的参数,而不影响此外的劳动。“ldirectord”能被“heartbeat”轻便地保管----运转、关闭。 将“ldirectord”放到/etc/ha.d/resource.d/目录下,然后在/etc/ha.d/haresources中加进壹行: node1 IPaddr::十.0.0.三ldirectord::www ldirectord::mail “ldirectord”能够手动开启、关闭。能够在无备份负载均衡器的LVS集群中使用它。 Xlinux的LATCH HA方案 正如后面所述,高可用性消除方案(HA)是极为主要的,许多厂家为此投入了大批量的钻研。在那之中,Xlinux发行版就提供LATCH HA消除方案。下边大家就一齐探访LATCH HA方案。 LATCH HA化解方案的最拍桌惊叹的系统结构:两台主机A、B共享1个磁盘阵列,A为专门的学问机,B为备份机。它们中间用1根心跳线来三番五次,那名称为“心跳检查评定”,主要通过一条奥迪Q7S23二检查实验链路来完结。LATCH HA也应用了用Ping来证实系统宕机的艺术。安装在主机上的HA软件通过心跳线来实时监测对方的周转情状,一旦正在职业的主机A因为各样硬件故障导致系统产生故障,主机B立时投入工作。怎么着,与IBM的HACMP有点像吧! LATCH HA完结了“高可相信性共享存款和储蓄”架构。该架构由八个或多个冗余服务器、三个共享冗余磁盘阵列、一个可选DBMS及LATCH HA系统软件构成。在LATCH HA的保卫安全下,公司的计算机种类能够提供不间断的音讯服务,制止由于硬件故障或一般爱惜所拉动的宕机,因此能够保持最好的可信性及最大程度地减小宕机时间。 方案应用 LATCH HA能够运用在各类集中式、客户机/服务器格局或OLTP系统中。同时其与市四上各类主流的数据库系统与OLTP软件(如:Oracle、SYBASE、Informix、Tuxedo)也都维持包容。LATCH HA同时提供了种种应用程序接口。因而,客户能够在其个人软件中合拢各样作用来保险系统的高可信性。 LATCH HA /HS贰仟 在线待机模式在这种情势下,一个劳务器作为主服务器。寻常意况下其承担全部的服务。别的1台服务器作为待机服务器(平常状态下除了监察和控制主服务器的状态,不举办别的的操作)。壹旦主服务器宕机,待机服务器就接手工业作,成为新的主服务器。客户还是能够享有壹致的服务器IP地址、NFS、数据、数据库及其它……那种应用方式近似于上边介绍的第一名应用情势(两台服务器实际上是在落成同四个效用利用),安装在主机上的HA软件通过心跳线来实时监测对方的周转情况,一旦正在专门的职业的主机A因为种种硬件故障,如电源失效、首要构件失效可能运转盘失效等导致系统发生故障,主机B立时投入职业。 LATCH HA /DA3000双机就绪情势在那种方式下,多个主机都看成主服务器,共享本人的磁盘阵列,各自负担壹部分服务。比方:服务器A在实施应用A, 服务器B在实行应用B, 多个主机在例行状态下分别独立运营本身的应用逻辑,五个主机同时又都作为对方的待机服务器,通过心跳线监察和控制对方的场合。壹旦某1服务器宕机,另1台服务器就担当全部的服务,为具备的客户服务。一旦服务器A产生故障,服务器B马上接管服务器A上原本的运用;可能服务器B发生故障,服务器A即刻接管服务器B上原来的行使,这是1种互为冗余的形式。 很确定,一旦某①服务器宕机,另一台服务器的专门的工作担任就比较重,于是就有了3主机格局。 LATCH HA /HC三千 三主机情势那种利用方式是最高档的HA应用格局,它既保证了系统的器具冗余,幸免系统宕机,而且又能确认保障在壹旦宕机的情状下有丰裕的系统财富可供使用。 在那种形式中,待机服务器C同时监察和控制主服务器A与B的情景。壹旦服务器A或B宕机,服务器C将承担其服务,为客户服务。那种系统结构既保险了系统的百色运转,又确认保障了系统财富。 Linux HA的化解方案当然不压制上述二种,但其核心境想是如出1辙的,即提供不间断的劳务。近期随着Linux操作系统不断走向成熟,作用不断巩固,尤其是其根据GPL和准星的PVM、MPI音信传递机制的脾性和在日常PC机上进一步好的高质量网络的支撑,全数这一个为基于Linux的集群系统的上进提供了稳固的才能基础,在把技能转化为现实的利用进程中,高级的HA应用以其稳固可相信的属性和与Unix比较价位上的优势而横空出世。随着基于AMD平台的劳务器业已变为宗旨业务和行使的主流服务器,Linux HA集群本事的运用亦将逐年普遍。

UNIX自个儿是为复杂性互联网化意况设计的操作系统,而AIX操作系统是最大的类别集成商IBM开垦的第一代UNIX,具备品质完善,使用方便,扩张性强,适合公司主要业务等特征,所以本文实例均在AIX境况下达成。

  《Oracle DBA实战战略:运行管理、会诊优化、高可用与一级试行》是日前Oracle数据库运行领域博古通今的一本文章,也是为数不多的既有雅量实行应用案例又含有实战方法论的著述。笔者依据其多年的运行检查判断经验,从数据库如何创立起来,安分守己地介绍了数据库的起步关闭进度,怎样安顿监听并连接到数据库,怎么样对数据库空间进行管制和督察,SGA的调解和优化措施,CHECKPOINT和SCN大旨机制,数据库的备份与还原,数据库品质优化的方法论以及Oracle Data Guard的布局和处理等内容。书中小编结合了汪洋的真实性案例,把团结多年的弥足敬爱经验融入当中,通过有些千头万绪案例的确诊进度来证实那一个总结的原理和知识点,同时,我并未简单地停留在案例会诊分析的范畴上,而是基于多量案例的阅历汇总,把标题的优化、会诊和平解决决升高到了方法论的框框上,进一步扶持读者知其然,知其所以然。

ü  中国移动:邮电通讯总部、北方邮电通讯9省、云南邮电通讯、辽宁邮电通信、奥斯汀邮电通信、浙江邮电通讯、云南邮电通讯、xinjiang邮电通讯、广东邮电通讯、新疆邮电通讯、广东邮电通讯、湖北邮电通讯、宁夏邮电通讯、西藏邮电通信、天津邮电通讯;

澳门新浦京娱乐场网站 1

一、故障概述

澳门新浦京娱乐场网站 2

ü  中国际联盟通:广东移动、西藏运动、山西运动、xinjiang移动、黑龙江运动;

HA集群结构图 HA实际上是两台(或越多)Computer通过自然措施相互监听,完结热备份。当个中Primary server出现难点时,Standby server能够自动马上接替工作,使用户认为不到停机。在Primary server复苏正常从此,Standby server又会把专门的学问还给Primary server。(出处:Sadie网)

服务器的在线方式故障是指服务器产生了常常错误。这个错误固然不一定系统崩溃。但潜移默化系统的例行运营,影响多少的健壮性,并有越发扩张危机的只怕。系统的标题和故障应该尽快开掘。并马上实行拍卖和平解决决,幸免进一步的伤害,引起严重后果。及早的预判。及早的开采。及早的排查是故障诊断的主要性。

小编简单介绍

ü  中夏族民共和国网通:广东网通、宝鸡通讯、洛阳通讯;

二、系统故障分析和判定

  周亮,大阪美创科技(science and technology)Oracle能力服务团队高管,Oracle 十g OCM。精晓Oracle数据库原理,对于数据库框架结构设计、运行、调优、排故有着丰裕的实战经验。引导Oracle技能劳务集团,为铺面客户提供繁多套数据库维护理工科人作。客户关系政坛、通讯、金融、公安、电力、交通、医疗、创立等行业。

ü  中国邮电通讯:西藏联通、江西维埃社会主义共和国缔盟通、塞尔维亚贝尔格莱德彻斯特联通、广西联通、广东联通、黑龙江联通、江西联通、安徽联通、浦那联通、广东联通;

系统硬件故障分析能够运用diag命令进行辨析和判别。

目录

ü  期货(Futures)行当:银河股票、华泰期货(Futures)、莱茵河股票(stock)、国际联盟股票、民族股票(stock)、金通股票;

在系统管理员状态下运作命令#diag进行硬件会诊程序。检查测试主机内硬件存在的主题素材。

推荐介绍序一
推荐序2
推荐序叁
前言

ü  政坛单位:江西省级地区级方税务部门、xinjiang电力、法国首都市松江区财政部、高雄公安、福建公安、乔治敦电力、广州社保、江汉油田、山西交通厅、达曼钢铁路中华全国总工会公司等

澳门新浦京娱乐场网站 3

第贰章 数据库故障的确诊方法与分析思路
一.1 数据库安装类故障
1.一.一 安装数据库时轻易犯的荒谬
一.1.二 无法起动安装分界面包车型地铁缓和措施
1.一.3 安装数据库的超级实践
一.二 数据库连接类故障
1.2.一 检查是或不是由互联网故障引起
一.2.二 检查是不是由主机能源引起
壹.贰.三 检查是或不是由监听故障引起
1.二.4 检查是还是不是由数据库故障引起
1.3 数据库HANG类故障
1.3.一 数据库全局性HANG的管理进程
一.三.二 数据库局地性HANG管理进度
壹.四 数据库质量类故障
一.四.1 品质类故障的拍卖思路
1.4.二 怎么样急忙牢固能源持有者
1.伍 数据误操作类故障的管理思路
一.六 数据库坏块类故障
壹.陆.壹 数据库对象坏块的管理思路
1.陆.二 SYSTEM/UNDO表空间损坏的管理思路
一.陆.三 数据库在线日志文件损坏的拍卖思路
1.6.四 调控文件损坏的拍卖思路
1.7 总结

ü  军队及其余:海军某部、火箭研商院、海军某部、新闻行当部(含辽宁、福建、广西、黑龙江、海南、广西、山西、西藏、宁夏和奥斯汀等信产部直属机构);

壹)基本体系

第三章 监听的配置和治本
2.壹 简析监听连接暗暗表示图
2.二 浓厚解析监听配置文件
贰.二.壹 多个超人的监听配置模板
二.二.二 监听的常用命令
贰.二.三 配置监听小名
贰.2.4 配置文件中的关键字解析
二.三 tnsping命令的效果和适用场景
二.四 监听的静态注册
2.4.一 静态注册的配置内容
二.四.2 监听状态中劳动名和实例名
二.5 监听的动态注册
贰.伍.1 动态注册的故事情节
二.5.贰 监听状态中的服务名和实例名
二.5.3 监听动态注册时的实例状态
二.5.肆 动态注册的小时点
贰.伍.5 实例不能够动态注册的管理思路
贰.伍.6 追踪实例的动态注册进度
二.6 巧用SSH的端口转载作用
二.七 追踪监听的行事进度
二.八 监听的优化思路
二.玖 会诊案例之一:RAC 某节点宕机之后的监听故障管理
2.十 会诊案例之贰:使用客户端追踪数据库连接难点
二.1一 会诊案例之三:本地sqlplus连接HANG的确诊和剖析

 

2)I/O设备

第三章 命令行创立和删除数据库
三.1 创制数据库的光景流程
3.2 理解Oracle SID
3.叁 检查操作系统情形
叁.四 规划数据库文件系统
三.伍 成立Oracle日志文件目录和密码文件
三.陆 创立Oracle参数文件
3.6.一 设置内部存储器相关参数
3.陆.2 设置进程有关参数
3.6.3 设置DB_FILES参数
3.6.4 设置BLOCK_SIZE和DB_FILE_MULTIBLOCK_READ_COUNT参数
三.陆.5 设置参数OPEN_CURSORS和SESSION_CACHED_CURSORS
三.陆.陆 贰个典型的数据库参数文件
三.7 创立数据库
三.七.1 数据库的始建脚本
三.七.2 使用OMF特性创立数据库
3.8 制造数量字典
3.8.1 执行catalog.sql
3.8.2 执行catproc.sql
3.8.3 执行utlrp.sql
3.8.4 执行pupbld.sql
3.玖 命令行创立RAC数据库
3.10 怎么着深透删除数据库

二     DSG在类似项目标打响表率和连锁经历

三)异步设备

第4章 SCN和CHECKPOINT
4.1 SCN
4.1.1 SCN的作用
4.一.二 SCN和岁月里面包车型地铁转变
四.2 SCN的最大阈值
四.三 两种普及的SCN
4.叁.一 调控文件中的SCN
肆.三.二 数据文件头中的SCN
四.三.三 数据块中的SCN
4.叁.四 日志文件头中的SCN
四.三.5 事务开头时的SCN
四.3.6 数据库的CU兰德酷路泽RENT SCN
4.4 CHECKPOINT
4.4.1 CHECKPOINT的作用
4.4.2 全量CHECKPOINT和增量CHECKPOINT
4.4.3 CHECKPOINT和REDOLOG
肆.四.肆 影响数据库展开速度的要素
四.四.5 CHECKPOINT的优化思路

二.1  成功案例的列表

4)图形设备

第5章 数据库的开发银行与关闭
五.一 实例与数据库
5.2 数据库参数文件
伍.2.一 参数文件的系列
伍.二.贰 参数设置
5.贰.3 参数文件之间的类型转变
5.三 简述数据库的开发银行步骤
伍.四 数据库的运维步骤之1:NOMOUNT
5.4.1 连接至空闲实例
5.四.二 读取数据库参数文件
5.4.3 分配SGA内存
伍.四.四 派生后台进程
伍.肆.伍 会诊案例:主机内部存款和储蓄器的使用率高达9玖%
五.伍 数据库的运营步骤之2:MOUNT
5.五.一 读取调整文件
五.5.二 校验调整文件
5.5.3 MOUNT数据库
伍.5.四 调控文件损坏的拍卖思路
五.陆 数据库的启航步骤之3:OPEN
5.6.1 详解CRASH RECOVERY
五.六.二 CRASH RECOVE奥迪Q5Y的故障管理思路
5.6.3 详解CACHE RECOVERY
伍.6.4 CACHE RECOVERAV四Y的故障管理思路
5.6.5 详解TX RECOVERY
伍.陆.陆 TX RECOVEQX56Y的故障管理思路
5.柒 数据库张开HANG的故障管理思路
伍.八 如何强制张开数据库
5.玖 如何急迅关闭数据库
五.玖.一 影响数据库关闭速度的成分
5.9.二 数据库不能关闭的确诊方法

DSG从二零零三年在神州确立以来,在RealSync这么些数据库复制产品的花色试行地点也由此了相当长的1段路。DSG始终以“客户供给为导向”的准绳提升协和的出品,到近来结束,DSGRealSync产品早已在电信、政坛、政券和商社利用,首要不外乎:

5)SCSI设备

第陆章 数据库空间的管理与监督
陆.1 数据库的上空管理
陆.二 表空间管理
陆.二.一 区管理和段管理
陆.2.二 一时段管理
陆.贰.叁 回滚段管理
6.二.四 表空间的监督脚本
6.二.5 维护表空间的注意事项
6.三 数据文件管理
陆.三.1 裸设备头上的保存音讯
陆.三.2 浅析数据文件的操作系统头
6.三.3 破解数据文件头内容
陆.三.四 维护数据文件的注意事项
陆.四 在线日志文件处理
6.4.一 破解日志文件头音讯
陆.四.2 LGW翼虎进度在日记文件中的写进程
陆.四.叁 维护日志文件的注意事项
6.伍 归档日志管理
6.伍.一 开启和停业归档格局步骤
陆.5.二 归档日志的命名参数
陆.伍.三 查看归档日志的多少个本子
6.5.肆 使用LO阿奇霉素N福特Explorer开掘归档日志
陆.伍.5 开启归档方式的专注点
6.伍.六 开启归档情势的益处
陆.6 闪回日志管理
陆.陆.1 数据库闪回相关的视图和参数
六.陆.2 数据库等第的闪回连串
6.陆.三 闪回日志空间的获释
陆.7 调整文件处理
六.柒.一 常见的支配文件故障管理
陆.柒.2 维护调节文件的注意事项
陆.捌 追踪文件管理

Realsync数据复制容灾软件近年来占到国内商铺份额的7/拾,客户包蕴: 

陆)存储设备

第10章 Oracle质量优化方法论
7.一 数据库质量优化的靶子
7.二 建设构造数据库质量基线
七.三 搜索关键变化
7.肆 定位首要影响因素
柒.伍 检查操作系统财富
7.5.1 查看CPU资源
7.5.二 查看内部存储器能源
7.5.3 查看I/O资源
7.5.四 查看网络财富
7.6 常见的数据库质量故障
柒.七 数据库品质优化的经常方法
7.柒.壹 数据库质量调度的为主流程
七.七.二 调治Oracle内部存款和储蓄器参数
7.柒.3 调治数据库在线日志
七.七.4 调解SQL的实践安排
柒.七.伍 优化对象的I/O读取
7.柒.陆 下落CUPAJEROSO锐界解析开销
7.七.7 别的数据库质量调解花招
7.八 利用OWI监察和控制数据库质量
7.8.一 OWI的基本原理
柒.八.2 等候事件的含义
7.八.三 监察和控制数据库的一手
柒.玖 利用时间模型监察和控制数据库质量

邮电通讯行业: 

柒)通讯器械

第七章 SGA的性质调解和优化思路
八.一 BUFFERAV四 CACHE的内部结构
8.1.1 BUFFER HEADER
8.1.2 HASH CHAIN和HASH BUCKET
8.1.3 LATCH:CACHE BUFFERS CHAINS
8.1.4 LATCH:CACHE BUFFERS LRU CHAIN
8.1.5 FREE BUFFER WAITS
8.1.6 BUFFER BUSY WAITS
8.二 BUFFETucson CACHE的优化指标
八.二.一 BUFFE大切诺基 CACHE的命中率
八.2.二 AWBMWX五报告中BUFFE猎豹CS陆 CACHE的有的争用目的
八.二.3 BUFFE汉兰达 CACHE大小的建议值
捌.三 BUFFEENVISION CACHE的优化思路
8.三.一 BUFFE帕杰罗 CACHE内部存款和储蓄器不足的优化思路
八.三.2 BUFFE凯雷德 CACHE的多少块争用的优化思路
捌.三.三 别的有关BUFFECR-V CACHE的优化思路
捌.四 SHARED POOL的内部结构
8.4.1 堆管理
8.4.2 CHUNK
8.4.3 FREE LIST
8.4.4 LRU LIST
8.4.5 RESERVED FREE LIST
8.4.6 SHARED POOL的SUB POOL技术
捌.四.柒 关于SGA内存抖动
八.5 LIBRA劲客Y CACHE的内部结构及等候事件
8.5.1 LATCH:LIBRARY CACHE
8.5.2 LIBRARY CACHE LOCK/PIN
8.5.3 LIBRARY CACHE OBJECT
八.六 浅析SQL的辨析进程
8.6.1 软解析
8.6.2 硬解析
八.六.3 细软解析
捌.7 ROW CACHE上的故障会诊方法
8.7.1 ROW CACHE的大小
8.7.2 ROW CACHE上的LATCH
八.7.三 诊断案例:LATCH:ROW CACHE OBJECTS故障管理
8.七.四 创立测试情状重现难题
8.八 SHARED POOL上的优化思路
捌.九 LOG BUFFE宝马X五上的优化思路
8.9.1 LOG BUFFER的大小
8.9.2 浅析REDO WASTAGE
八.九.三 LOG FILE SYNC等待事件
八.玖.四 缩短日志量的章程

国都运动、广东活动、河北活动、广东活动、广西移动、福建邮电通信、江西邮电通讯、黑龙江邮电通讯、青海邮电通讯、山东邮电通讯、辽宁邮电通讯、吉林邮电通信、海南邮电通讯、宁夏邮电通讯、山西邮电通讯、阿德莱德邮电通讯、齐齐哈尔邮电通讯、大连邮电通信、银川邮电通讯、山东网通、福建联通、江苏联通、湖北联通、山东联通、福建联通、四川维埃社会主义共和国结盟通、江苏联通、贵州联通、广东联通、山西联通、内蒙联通、浙江联通、四川联通…

8)多媒体设备

第拾章 数据库的物理备份与回复
九.一 物理备份与还原的基本概念
九.壹.1 物理备份的基本概念
九.壹.2 物理备份时的瞩目点
玖.一.三 物理复苏的基本概念
玖.1.4 物理复苏时的注意点
九.二 数据库的冷备份和复苏
九.二.一 冷备份数据库步骤
玖.二.二 冷备份下的数据库苏醒
玖.叁 数据库手动热备份和回复
九.三.1 手动热备份
玖.叁.二 热备份下的数据库恢复
9.四 使用大切诺基MAN备份和苏醒数据库
9.4.1 RMAN的结构
玖.4.二 LacrosseMAN占用的内部存款和储蓄器
九.4.3 LANDMAN备份与还原示例
九.5 数据库闪回
9.5.1 数据库闪回和常见闪回点
玖.5.贰 强制闪回点

Linux下的高可用性方案研究,如何在服务器在线模式诊断硬件故障。金融行业: 

#diag —S

第柒章 物理Data Guard的计划与治本
10.1 Data Guard的原理
10.1.1 解析Data Guard原理图
10.一.贰 Data Guard日常运作的前提
10.贰 Data Guard的敬爱情势
十.2.一 最大珍视方式
10.2.二 最大可用形式
十.贰.3 最大品质格局
10.二.肆 切换珍重格局
十.3 配置物理Data Guard
十.叁.壹 配置Data Guard简要流程
拾.叁.二 配置Data Guard相关参数
10.4 管理物理Data Guard
十.四.一 配置Data Guard的注意点
十.4.2 管理Data Guard的瞩目点

广发银行、中中原人民共和国股票有限支撑金监察和控制大旨、印度洋保险公司、中中原人民共和国金融期交所、华夏基金、易方达基金、招引客商基金、南方基金、鲁证证券、中国际清算银行行股票(stock)、东吴股票、国泰君安股票、中山大学期货(Futures)、银河股票(stock)、民族股票(stock)、宏源股票(stock)、新时期股票、北京期货(Futures)、远东股票、印度洋股票、东兴证券、万联股票(stock)、金元期货(Futures)、信达证券、江南期货(Futures)、华泰股票、德班股票、信泰股票(stock)、东吴股票、密西西比河证券、国际订盟股票、波的尼亚湾股票、东南股票(stock)、四川股票(stock)、金通股票(stock)、中原证券、财达证券、北边股票、国盛股票、国海期货、华福股票、恒泰股票(stock)、湘财股票、华鑫股票(stock)、财富证券、中天股票(stock)、财通股票、中投期货…

在全数财富上运营会诊。

百度网盘无偿下载地址:

当局行当: 

三、查看系统的错误日志

------------------------------------------分割线------------------------------------------

国都电力、江苏电力、江西电力、广东电力、西藏电力、宁夏电力、天富热电、利兹电力、江西省级地区级税、罗利财政、北京松江财政、青海省交通厅 、四川省征收稽查局、蛇口码头、新奥尔良港、河北公安、马上饶公安、尼科西亚交通警官、Adelaide有线、曲靖社会养老保险、中中原人民共和国邮政、汉诺威FAW、波特兰钢铁、索菲亚华夏通集团、Alibaba、安徽省级地区级税11地市征管数据聚集容灾备份系统、江西省电力12地市经营出卖数据汇总容灾备份…

在系统运行时,一些种类错误会记录在errlog中,当中有个别错误还会在顶峰上出示。检查错误日志可用以下命令

Linux下的高可用性方案研究,如何在服务器在线模式诊断硬件故障。FTP地址:ftp://ftp1.linuxidc.com

 

澳门新浦京娱乐场网站 4

用户名:ftp1.linuxidc.com

这么些种类都为DSG RealSync的奉行积累了难得的经历。

4、DUMP

密码:www.linuxidc.com

当系统一发布出软硬件故障导致宕机时,系统将募集故障发生时系统的内部存款和储蓄器和计算机状态等音信,发生DUMP文件,并且在液晶屏上出示88八起来的代码。记录第贰段开始的故障码,并分析DUMP状态码有助于分析故障原因,找到难点所在。

在 2014年LinuxIDC.com7月Oracle DBA实战战术:运营管理、检查判断优化、高可用与最棒执行

 

五、平时检查服务器状态的项目及其有关命令

下载格局见 http://www.linuxidc.com/Linux/2013-10/91140.htm

贰.2  成功案例的概貌

用作接济。定期运转检查服务器品质的有关工具和指令,有助于控克制务器状态,预测故障点,相关命令包含:

------------------------------------------分割线------------------------------------------

序号

客户名称

实施日期

系统情况及需求

实施后情况

1

长江证券股份有限公司

2004.12.31

系统环境:集中交易系统分布在两台HP安腾服务器上,服务器分别配备4CPU和8G内存。数据库版本为Oracle9i,组成RAC。数据量为100GB左右,每天日志量为10-20GB左右。异地网络链路2M。                                       应用需求:1.本地数据库复制一份Oracle数据库副本,实现本地数据查询,业务分担以及本地业务接管功能;2.异地容灾通过窄带宽链路将数据复制到上海灾备中心提供异地容灾功能; 

1.满足设计方案的目标,实现1:2的容灾复制模式;                                     

2.本地数据库副本实现查询业务分担,提高主应用的处理能力和查询响应速度,客户满意度上升;                           

3.低带宽情况能够保证数据复制传输的应用要求;                                               4.异地容灾系统演练成功; 

2

华泰证券股份有限公司

2006.02.15

系统环境:集中交易系统分布在两台IBM S80服务器上。数据库版本为Oracle9i,组成RAC。数据量为80GB左右,每天日志量为10-20GB左右。异地网络链路2M。                  应用需求:异地容灾通过窄带宽链路将数据复制到异地灾备中心提供异地容灾功能; 

1.满足设计方案的目标,实现1:1的容灾复制模式;                                                            

2.低带宽情况能够保证数据复制传输的应用要求;                                                           

3.异地容灾系统演练成功; 

3

中国移动通信集团广西公司

2005.12.30

系统环境:营业数据库布放在两台IBM P690服务器上,数据量有1.1TB左右;客服数据库布放在另外一套HA环境下,数据量有100GB左右。数据库版本为Oracle9i,组成RAC。每天日志量为300GB左右,出账高峰期每天日志量达到600GB左右。本地网络链路1000M。应用需求:1.将两个应用数据库数据复制到1个Oracle数据库副本中,实现本地数据查询系统优化部署、业务负载分担等功能;2.提高容灾系统接管成功率,保证100%的业务连续性要求; 

1.满足设计方案的目标,实现2:1的容灾复制模式;                                                           

2.集中数据库副本实现查询业务分担,提高主应用的处理能力和查询响应速度,客户满意度上升;                                                           

3.利用数据库副本Open机制,保证容灾切换可靠性,提供100%的容灾切换支持;                                              

4.应急容灾系统演练成功; 

4

河北省地方税务局信息中心

2005.12.27

系统环境:11个地市税务征管系统布放在两台IBM服务器上,组成HA双机环境。地市税务征管系统数据量有50GB左右;数据库版本为Oracle9i,异地网络链路2M。                                                     应用需求:1.将11个地市税务征管数据库数据分别复制各本地1个Oracle数据库副本中,实现本地数据查询系统优化部署、业务负载分担等功能;2.将11地市税务征管数据库数据复制到省中心1个Oracle数据库副本,作为全省税务征管系统的集中容灾系统;3.省中心Oracle容灾数据库可为数据仓库提供数据抽取功能。 

1.满足设计方案的目标,实现11:1:1的容灾复制模式;                                                      

2.本地数据库副本实现查询业务分担,提高主应用的处理能力和查询响应速度,客户满意度上升;                                                           

 3.全省税务征管系统集中容灾的目标实现;                                                   

4.低带宽情况能够保证数据复制传输的应用要求;                                                              

5.省中心Oracle集中容灾数据库能够为数据仓库提供数据来源,满足数据抽取功能;                                                  

6.异地容灾系统业务接管及数据修复成功;

5

江西省电力公司

2007.12.18

系统环境:12个地市电力营销系统布放在两台HP安腾服务器上,组成高可用架构。地市电力营销系统数据量有10-50GB左右;数据库版本为Oracle9i,异地网络链路100M(2M冗余)。                                                          应用需求:1.将12地市电力营销数据库数据复制到省中心1个Oracle数据库副本,作为全省电力营销系统的集中容灾系统;2.省中心Oracle集中容灾数据库提供决策分析、网上营业厅、监控中心和查询系统的应用功能; 

1.满足设计方案的目标,实现12:1的容灾复制模式;                                              

2.省中心容灾数据库副本实现查询应用功能,提高主应用的处理能力,客户满意度上升;                                                     

3.全省电力营销系统集中容灾的目标实现;                                                   

4.低带宽情况能够保证数据复制传输的应用要求;                                                                                                        5.异地容灾系统业务接管及数据修复成功;

6

中国电信股份有限公司福建分公司

2006.12.14

系统环境:计费数据库布放在两台IBM P595服务器上,14CPU,数据量有2.2TB左右;统计数据库布放在另外两台IBM P595服务器上,数据量有1.5TB左右。数据库版本为Oracle9i,组成RAC。每天日志量各为110GB左右,本地网络链路1000M。                                                       应用需求:1.将两个应用数据库数据复制到1个Oracle数据库副本中,实现本地数据查询系统优化部署、业务负载分担等功能;2.提供24个月的话单数据保存和对外查询业务; 

1.满足设计方案的目标,实现2:1的容灾复制模式;                                                           

2.集中数据库副本实现查询业务分担,提高主应用的处理能力和查询响应速度,客户满意度上升;                                           

7

上海市松江区财政

2005.10.12

系统环境:国库支付数据库布放在两台IBM 服务器上,数据量80GB左右;数据库版本为Oracle8i,组成RAC。异地网络链路100M。                                                            应用需求:1.将区属所有机关单位的财政数据复制到财政数据中心的1个Oracle数据库副本,作为国库支付系统的集中容灾;2.一期将三个应用数据库数据复制到1个Oracle数据库副本中,实现容灾和数据仓库抽取等功能; 

1.满足一期设计方案的目标,实现3:1的容灾复制模式;                                                                                         

2.国库支付系统财政数据集中容灾的目标实现;                                                     

3.低带宽情况能够保证数据复制传输的应用要求;                                                    

5.Oracle集中容灾数据库能够为数据仓库提供数据来源,满足数据抽取功能;                                                  

6.集中容灾系统业务接管演习及数据修复成功;

8

中国联通有限公司湖北分公司

2007.03.19

系统环境:营业、账务和入库数据库布放在四台IBM P690服务器上,每台服务器22CUP、18GB内存,配置成集群。每个数据库数据量分别有800GB-1.4TB左右。数据库版本为Oracle10g,组成RAC。每天日志量为300GB左右。本地网络链路1000M。                                               应用需求:将三个应用数据库数据复制到本地1个Oracle数据库副本中,实现本地数据查询系统优化部署、业务负载分担等功能; 

1.满足设计方案的目标,实现3:1的容灾复制模式;                                                           

2.集中数据库副本实现查询业务分担,提高主应用的处理能力和查询响应速度,客户满意度上升;                                           

9

中国网通(集团)有限公司辽宁省分公司

2004.03.11

系统环境:六大数据库各布放在两台IBM P690服务器上,总数据量有35TB左右。数据库版本为Oracle9i,分别组成RAC。本地网络链路1000M。                                                        应用需求:1.将六大应用数据库数据复制到1个Oracle数据库副本中,实现本地数据整合,消除分散系统的信息孤岛;2.提供六大业务系统数据库关键数据的集中容灾,保证100%的业务连续性要求; 

1.满足设计方案的目标,实现6:1的容灾复制模式;                                                                                         

2.六大业务系统关键数据集中容灾的目标实现;                                                                                                           3.完成六大业务数据整合和优化过程;                                                  

4.集中容灾系统数据修复成功;

10

中国联通有限公司福建分公司

2008.01.03

系统环境:营业和计费数据库布放在四台IBM P690服务器上,配置成高可用架构。每个数据库数据量分别有600GB-1.2TB左右。数据库版本为Oracle9i,组成RAC。每天日志量为150GB左右。本地网络链路1000M。                                               应用需求:将两个应用数据库数据复制到本地1个Oracle数据库副本中,实现本地数据查询系统优化部署、业务负载分担等功能; 

1.满足设计方案的目标,实现2:1的容灾复制模式;                                                           

2.集中数据库副本实现查询业务分担,提高主应用的处理能力和查询响应速度,客户满意度上升;               

11

中国联通有限公司山东分公司

2008.02.19

系统环境:计费数据库各布放在四台HP RP8400服务器上,复制数据量有2TB左右。数据库版本为Oracle9i,分别组成RAC。本地网络链路1000M。                                    应用需求:1.将4个本地数据库复制一份Oracle数据库副本,实现本地数据查询,业务分担以及本地业务接管功能;2.对4个本地数据库的关键数据提供应急容灾功能; 

1.满足设计方案的目标,实现4:1的容灾复制模

式;                                                            

2.集中数据库副本实现查询业务分担,提高主应用的处理能力和查询响应速度,客户满意度上升;                                                            

3.利用数据库表级复制功能,对关键数据实现容灾保护;                                               

4.Oracle容灾数据库数据恢复演练成功;

13

深圳蛇口集装箱码头

2008.03.16

系统环境:生产数据库布放在Compaq的服务器上,操作系统为TRU64,8G内存的两台Compaq组成的RAC。数据库版本为Oracle10g,数据量为50GB。网络链路带宽为100M。                                                       应用需求:1.实现关键生产数据库的数据容灾;2.提高容灾系统接管成功率,保证100%的业务连续性要求; 

1.满足设计方案的目标,实现1:1的容灾复制模式;                                                            

2.满足关键数据库的数据容灾要求;                                                     

3.异地容灾系统演练成功;

14

中国电信股份有限公司贵州分公司

2008.04.07

系统环境:帐务数据库布放在HP-IA64 服务器上,26CPU/20G,配置成高可用架构。数据库版本为Oracle9.2.0.5,实际复制数据量为120GB左右; 97系统数据库布放在IBM服务器上, 28CPU/20G,数据库版本为Oracle9.2.0.5,实际复制数据量为280GB左右。本地网络链路1000M。                          应用需求:1.将两个应用数据库关键数据表复制到目标数据库副本,实现本地数据查询,业务分担功能。2.替换现在已有的利用Oracle高级复制模式复制数据,减少对生产数据库的压力; 

1.满足设计方案的目标,实现2:1的容灾复制模式;                                                           

2.数据库副本实现查询业务分担,提高主应用的处理能力和查询响应速度,客户满意度上升;                                                    

3.完全替换Oracle高级复制,减少了生产端数据库的压力;                                                 

4.实现查询业务完全从生产库剥离,实现业务优化部署;

15

东兴证券股份有限公司

2008.04.08

系统坏境:集中交易系统布放在两台HP580-G4服务器上,分别配备8CPU和32G内存。数据库版本为Oracle10g,组成RAC。数据量目前为100G左右。每天日志量为10-20GB左右。异地网络链路为4M。
应用需求:1.本地数据库复制一份Oracle数据库副本,实现本地数据查询,业务分担以及本地业务接管功能;2.异地容灾通过窄带宽链路将数据复制到北京灾备中心提供异地容灾功能; 

1.满足设计方案的目标,实现1:2的容灾复制模式;                                                           

2.本地数据库副本实现查询业务分担,提高主应用的处理能力和查询响应速度,客户满意度上升;                                                           

3.低带宽情况能够保证数据复制传输的应用要求;                                                           

4.异地容灾系统演练成功;

16

信达证券股份有限公司

2008.04.16

系统环境:集中交易数据库为Oracle10G RAC,布放在两台IBM P570上,配置成高可用架构。实际复制数据量有100GB左右,本地和同城灾备中心网络链路均为1000M。                        应用需求:1.将集中交易数据库复制到同在证通机房的灾备中心数据库上,该数据库为Oracle10G主机为IBM P570,实现本地数据查询,业务分担以及本地业务接管功能;2.将集中交易数据库复制到同城的华侨城容灾机房,以适应同机房内出现灾难的情况,该灾备中心数据库为Oracle10G主机为IBM P570。 

1.满足设计方案的目标,实现1:2的容灾复制模式;                                                           

2.本地数据库副本实现查询业务分担,提高主应用的处理能力和查询响应速度,客户满意度上升;                                                           

3.实现同城异地的容灾要求;                                                           

Iostat

越多Oracle相关消息见Oracle 专题页面 http://www.linuxidc.com/topicnews.aspx?tid=12

 

查阅系统I/O状态。分析CPU对各端口的服务占比,精通硬盘swap空间和内部存款和储蓄器的数额比例关系。

正文永恒更新链接地址:http://www.linuxidc.com/Linux/2014-07/104100.htm

 

Vmstat

澳门新浦京娱乐场网站 5

二.叁  湖北移动营业和客服数据库数据复制应急查询平台

查看系统虚拟内部存款和储蓄器状态信息。

  政工须求

Sar

将新疆运动在白沙机房(BOSS一.5机房)新建多个基于SAN境况的微型Computer种类,有陆个数据库(Oracle九i RAC),在这之中的3个数据库(2个是Oracle 九iRAC,七个节点,此外三个是双机互备方式)依照业务需求各自复制到应急数据库(Oracle 9i Single)的1个实例,由此需购买相应的复制软件进行数据库的复制。

Sat查看系统活动状态音讯。

本工程是对当中的营业数据库和客服数据库举行理并答复制,复制到应急数据库。

Topas

数据库复制系统的树立应促成将营业库和客服库的数码变动分别复制到应急库,使得应急营业库和应急客服库的数额和生育连串的营业库及客户库的多少同步。并能在生产系统的营业库也许客户库有故障时,替代故障库,接管应用。当故障库修复之后,能及时将应急库中的数据同步到修复后的生育数据库。

Topas能够监督系统内部存储器,CPU,I/O端口,swap空间的处境

  方案设计 

no 命令用来修改内核参数。调治系统品质。

据他们说湖北运动多少复制系统的事体供给,采纳DSG RealSync软件完成数据复制:系统1体化结构如下图所示:

Svmon

 澳门新浦京娱乐场网站 6

svm on 命令用来查看系统当下的内存的现实性运用。

 

6、结论

ü 生产种类

任何完好的系统它都不或者一点破绽百出或故障都未有,网络服务器系统在运维时连连会或多或少的标题应际而生,尽管AIX系统有着活动检查判断错误和故障的本事,但用户了解系统,并定时监视检查判断系统的运维境况,方可制止不须要故障的发生。本文相关保障方法在IBmp520服务器,AIX 六.一操作系统下促成通过。

山西移动BOSS 一.伍系统中需求本期工程进展复制的业务类型首要不外乎两种:

...

客服:系统的数据量约为十0GB

帐务:系统的数据量约为800GB

营业:系统的数据量约为500GB

客服数据库单独运营,运行在两台IBM P690服务器上,组成RAC蒙受;

帐务和平运动营多个业务运转在二个ORACLE DATABASE的五个USE奥迪Q伍上,运营在两台IBM P690服务器上,组成RAC情状;

在容灾系统上设置多个ORACEL INSTANCE,运转七个ORACEL DATABASE。分别对应生产系统的客服数据库和营业帐务数据库中的五个用户。

  品质参考

ü  全同步

DSG RealSync提供了不停机的第二回全同台功用,该意义支撑数据库在健康工时不间歇的动静下开始展览全同台。制止了运用储存拷贝格局张开全同台时必需须要的事体暂停。

对于山东运动的数据量,四个用户数据量约为800GB,采取十一个冒出任务张开全同台,同步时间总共约五钟头左右。

ü  日记分析速度

系统每天处理的日志量达到400GB左右.

ü  CPU财富速度

源端日志分析CPU占用量为单个CPU的1/10,高峰期可达到单个CPU的百分之6十.

  化解方案特点

容灾与其他任何保管政策一样,当未有苦难出现时,大家根本不能够意识到容灾系统所起到的作用,不可能回收容灾系统建设所需的大气入股。但从系统安全性角度怀恋,我们又必须为根本的政工支撑连串建设最可行的不幸苏醒消除方案。不过在大诸多动静下,当未出现天灾人祸时,大家的容灾端系统总是处于空闲状态,费用大量投资买来的种类根本无法有效运用。这么些主题材料直接搅扰着用户。

为此我们采纳双active的布局,让容灾系统的数据库也处在OPEN状态,那样实在河北运动就具有了第贰数码基本,而不唯有是1个横祸备份系统,通过第1数额核心可以达成如下效果:

ü  基本业务的灾备平台 

经过数量同步创立的第1数量主导能够兑现对事情根本数据的容灾及维护,在不影响生育数据库质量的同时为生产数据库在地头或异地建构1份准实时镜像,以保障在生产数据库发生魔难时可利用容灾数据库进行业务接管和数据恢复生机。

ü  业务负载分担 

其次数据基本的数量处于实时可读取状态,数据库处于OPEN状态,实现BOSS系统业务模块的重新布置。

透过第一多少宗旨完毕对BOSS宗旨系统的政工模块实行负荷分担,将这个只对数码举行读取操作的模块都迁移到第二数目大旨上来,首要不外乎:

ü  地市总结报表

ü  地市职业查询

ü  提供其余系统的数码访问接口;

那般作将直达三个便宜:

ü  进步多少访问的频率,提升外围系统安插的狡滑;

ü  提升基本系统的运作效用,提升级中学央系统运营的平静和可信性;

 

二.四  辽宁邮电通讯的计费查询平台选择

本项指标建设供给是:为四川邮电通讯聚集计费系统上线后,创建一个单身的查询系统,将计费数据库和总括数据库上的数目同步到1个不错的查询数据库中,通过该查询数据库实现26个月的计费话单数据保存、对外数据接口、以及对外查询业务。

  系统方案

依靠湖南邮电通讯数据复制系统的事务供给,选取DSG RealSync软件将生产种类上的多少复制到历史查询系统上来。系统结构图为:

 澳门新浦京娱乐场网站 7

多少复制的数据源由计费数据库和总括数据库几个连串结合: 

l  Bill数据库(计费数据库):

由两台IBM P595(14*2GHzcpu)组成,采用Oracle RAC模式;

话单数据库上的数据包罗话单数据和总括数据:话单数据保存叁 四月;

数据库大小体量为:2233.6943四;

每一日发生的Log日志量大约为12二GB。

l  Stat.数据库(总结数据库):

由两台IBM P595组成,采用Oracle RAC模式;

仓库储存短时间的计算数据;

数据库大小陈设体量为:1500GB;

每一日发生的Log日志量布署为拾0GB左右。

l  查询服务器

运用IBM中高端UNIX服务器和高品质磁盘阵列,安装贰个Oracle数据库系统。在数据库中创造五个User,2个User对应Billing数据库,贰个User对应Stat.数据库。

  第一质量和指标参数:

在数码同步进度中,DSG RealSync表现出了充裕强劲的连串质量:

l  全同台质量:360GB/小时(4陆GB在440s全同台导出结束);

l  实时同步品质:每日发生拾0GB的ArchiveLog景况下未出现日志分析和装载的延迟,完全能够跟得上系统的日志发生速度。

l  CPU和内部存款和储蓄器能源占用:DSGRealSync在实时同步进度中的CPU占用<一%,内部存储器占用大概在400M左右。

 

2.五  福建地方税务1壹地市地点复制和数量汇总上收和容灾应用

  作业要求 

湖北省级地区级税税收业务种类当下应用了在各省局分散应用形式,即十三个市局分别有独家的多寡大旨,肩负税务征管和帐务管理。

为了贯彻对第贰作业数据的各地容灾备份,同时落到实处多少的省级集中用于决策协助系统的数据源,须要在省局建设构造外市局数据的准实时备份。

同时为了在内地局本地提供查询业务,必要复制到本地另1台服务器上壹套税务征收和管理数据用于查询。

先是进行数据上收到省立中学央,上收的意在:

l  提供数据备份:将13个市局和省直属局的政工数据同步到省局,作为外地局本地备份的增加补充,当市局数据发生损坏时,可由此省骨干的备份数据开始展览恢复生机;

l  提供专业接管:当市局的政北京工人篮球馆系有磨难发生而不能够在明确的时日内恢复生机的时候,能够透过省基本的备用系统一时半刻接管该市局的关键业务,以保证职业的连续性为指标。

l  数据应用:拾3个市局和省委和省政坛直属机关属局同步到省局的数目,将用作省主旨的数据商旅系统的数据源。

并且,在市局本地再复制产生一套税收征收和管理数据,用于地方数据查询和表格工作。

 

  解决方案 

每种市局由两台IBM服务器组成高可用性框架结构。系统各自运营一套ORACLE玖i数据库。

 澳门新浦京娱乐场网站 8

数量上收系统是将12个地市征收和管理数据库上的数额实时复制到省骨干的汇聚数据库上,聚集数据库起到备份、业务接管和多少运用四个目标。

 

二.六  额尔齐斯河期货聚集交易系统灾备应用

  一、业务必要:

长将股票从200四年早先下手全公司大聚焦交易系统建设办事。聚焦交易系统的目标是兑现所属全数网点数量大聚集,涵盖莱茵河期货方今幸存业务(AB种股票(stock),基金、期货、3板、集合理财、银证通、多币种等),整合并合营亚马逊河股票将在展开的管教、股票等可预感金融业务的汇总交易系统。是1套集金融产品研究开发、出售、管理为紧凑的新闻体系。

乘势证券聚焦交易系统的建设,对系统的安全性、可信性和事情三番五次性方面提议了相当高的渴求。因为该系列是黄河股票(stock)的事情能够平常运行的前提和保障。

而大量的意外事件,如不可抗自然灾荒(地震、内涝)、意外不幸(火灾)、战斗、恐怖事件(如911)、外界因素电力网、通信等处界因素、运行大旨容错措施失效等原因都将会导致聚集交易系统的数量丢失、业务暂停,势必产生巨大的经济损失。

为此,尼罗河股票提议了建设1套高效、可相信、投资回收比高的不幸备份系统。确认保证系统的数目安全和灾殃发生时的比十分的快还原。

  二、消除方案

DSG作为数据管理平台化解方案的提供商,推出了席卷数据安全、数据共享和数码生命周期管理等在内的任何数码管理消除方案。

该消除方案中的数据库复制才具realsync就是为数量复制和备份提供了超级的消除方案。该软件在工作组和商城级的主要性应用的容灾匡助上,能够提供比竞争对手更低本钱、更加高投资回报、结构越来越灵敏、更便于施行和护卫的容灾解决方案,提供对主流Linux和Unix等跨平台的Oracle数据库系统的复制和备份辅助。

在巨型集团和数据中央级的重大应用上,RealSync是一心知足数码大旨级每秒数千条交易量的实时复制支持、收缩多少丢失。同事通过处于张开(open)状态的备份数据库提供数据查询、总括报表等辅助集团应用模块的重新布置。

为此,黄河股票选取了DSGRealSYnc作为其交易系统的复制和备份化解方案:

 

 澳门新浦京娱乐场网站 9

  系统结构:

如图所示,莱茵河股票(stock)聚焦交易系统容灾备份实现如下指标:

(壹) 当地复制:

将聚齐交易系统复制到局域网里面包车型客车系列上用来查询和地点专门的职业接管成效;

(2) 远程异地复制:

将位于纽伦堡的集中交易系统远程复制到新加坡证通灾备核心,广域网链路二M.

(3) 满意专业备份和回复目的

渴求灾产后虚脱生时数据丢量调节在细微范围以内,业务恢复生机事件缩小,减弱对股票用户的交易影响。

  支撑平台:

数据库:oracle 9.2.0.4 RAC

操作系统:HP-UX

  使用成效和特点:

总的说来,接纳DSGRealSync数据复制和备份消除方案,卓殊适合莱茵河股票(stock)的事务须要:

(1)  援助一:2的复制方式,满意二个数据源复制到多少个对象数据库的作业供给

(二)  备份数据库出于展开状态,通过该展开数据库可用于分担聚集交易系统的询问和总结等作业功用

(叁)  辅助异构格局的数额复制,扶助数据源、目的数据库之间接选举择灵活的软件和硬件平台,而不须求供给壹律的操作系统和数据库版本

(四)  裁减带宽占用,满足二M带宽的广域网复制供给

(伍)  数据复制实时性好,数据复制频率可调动,复制周期可裁减到秒级以内,缩短数量丢失。

 

贰.七  西南股票灾备一体化方案

西南某股票(stock)股份有限集团是经中国证券监督管理委员会许可设立,于200一年7月行业内部注册开张营业的有价股票(stock)经营单位,注册资本金一10亿元人民币,注册地为湖南省宝鸡市,公司在香岛存在投资管理、客户资金财产管理、投资银行、研究开发焦点等业务部门,并在云南、新加坡、东京、尼科西亚、青海开设了2二家期货(Futures)营业部和1肆家股票(stock)服务部。 

  作业需要

     东南某股票聚焦交易系统在200伍年促成交易集中并进级到Linux Oracle平台,系统稳固运行。200六年以来,随着中炎黄子孙民共和国股票市镇转牛,交易活跃,系统所接受的压力更是大。一旦聚焦交易系统出现故障,将导致惨重的结局。由此,西南某股票思量晋级将来的应用级容灾系统,选用标准的灾备软件对集中交易系统进行宏观的掩护,包涵:

1)     达成灾、备一体化的数量保护 

对集中交易系统完毕灾、备壹体化保险,即在出现地震、火灾、存款和储蓄故障、大面积电力中断、网络中断等景色下使用容灾系统完成专门的学问飞速接管;在产出诸如表数据丢失、数据逻辑错误、软件BUG等情事下可以透过备份系统飞快在线修复系统。同时重组三种灾备方式,做到全体尊敬。

2)     贯彻本、异地结合,查询、容灾结合的数额同步 

在主导机房和异地机房之间各保留1份联合数据。中央机房的一路数据用于历史查询、数据解析等,作为“温备”数据。异地联合数据用于容灾切换,作为“灾备”数据。

3)     重申应急处理及练习体制的建设,达成灾备制度有限匡助 

在关键时刻容灾切换是不是可以成功,不但取决于灾备软件,而且和常常的灾备演练、系统一保险证以及应急体制有关。因而,东北某股票(stock)供给灾备系统的建设同时应建设应急管理制度、演练制度并摇身壹变标准文书档案和应急指点手册,切实拉长容灾系统的接纳效益。

  消除方案

依附东南某股票(stock)的实际上处境,DSG选取RealSync SnapAssure的灾备1体化方案来满意客户的供给。化解方案暗暗提示图如下:

 澳门新浦京娱乐场网站 10

      如上海体育场合所示:

一)    配置两套DSGRealSync软件,分别完结从本地交易服务器组同步数据到骨干机房的询问服务器以及异地机房的灾备服务器,达成地点和异地的数量同步;

二)    同步到主旨机房的多寡,用于历史查询、数据总计分析应用;同步到异乡机房的数据,基本上不选拔,作为容灾数据;数据同步实时举办,保持和交易系统壹致。

三)    配置1套DSG SnapAssure软件,达成从贸易服务器组到灾备服务器的各省备份。两地之间的互联网为千兆单模光导纤维。

肆)    备份到异乡的汇总交易系统数据,能够用来急速回涨恐怕在线修复系统。数据备份每种交易日施行三回,每一回备份包蕴数据文件、日志文件、调节文件以及参数配置文件等。

5)    在类型进行中,分析体系可能碰着的种种故障,依据故障处境判定故障品级和妨害程度;分析二种灾备方式对两样故障的管理的利弊,选取最优的拍卖方案,并写明详细的操作步骤,汇总成为应急手册。依照以上应急管理手册,进行普通的勤学苦练,通过平时的排练来推进类别故障时反应技艺和故障处理手艺。

  采纳功能

西北某股票(stock)的灾备一体化系统是小编国期货行当内使用先进的灾备软件创设关键业务种类全套数据爱惜的首例。该种类建成后,可以完结:

一)  大幅度升高聚焦交易系统在各类故障意况下的安全性。消除方案针对系统或然遭遇到的储存故障、主机故障、数据库故障、文件丢失、日志文件丢失、表丢失、数据13分、大面积停电、网络中断、地震等横祸都制定了相应的拍卖方法,从而为可能爆发的故障希图好了管理预案。和别的的容灾消除方案相比较,本方案的点子更周全和现实性,更有指向,覆盖了不过的容灾才能无法化解的逻辑故障难题那一个本事死角,并且提供了越来越多的在线修复的手法,从而令客户在直面种种横祸是力所能致采用最合适的方案实行高效处理,把对系统的熏陶减小到最少。

二)  应急处理办法与技巧花招融为一体。在本项目中,除了软硬件种类的设置配备,越来越多的生气被投入到针对实际故障意况下的切换、苏醒以及修复等的管理和演练,从而将才能花招和管理故障的流水生产线、机制等整合起来,从而为今后的种类保证、管理和应急管理铺平了道路。

三)  到达了越来越高的本领目标。测试声明,在平常的贸易复制中,数据延迟时间为1-二秒;数据库的首次数据同步时间不超越20分钟,切换时间不超过4分钟;数据全库备份时间不超越半钟头,增量备份时间数分钟,全库复苏时间1一分钟。以上本事指标既申明了灾备软件日常运作的便捷,也申明了故障情状下能够落成的拍卖技术。

 

2.八  安徽联通的复制利用

  类别必要

江西联通的归结营帐系统结合情形为:

长机设备: 选用4台IBM P690 小型Computer,每台小型计算机22CPU,1八 GB内部存款和储蓄器,安装IBM AIX 伍.二操作系统, 配置为集群。

存储设备: 选取EMC DMX 三千。

数据库  : 接纳Oracle九i数据库,分别为运转、帐务和入库,三个数据库每库体量约800-1400GB。

  消除方案

系统应用DSGRealSync软件将综合资帐等系统的数量分流壹份到专门的种类,从该系列上贯彻地市查询、历史查询、数据抽出以及总括分析等效果。

 澳门新浦京娱乐场网站 11

系统利用一台IBM S8伍小型Computer和EMC Symmetrix 880磁盘阵列用作查询平台。

查询平台上运用Oracle 九i数据库,分别创立多个数据库实例,为运转、帐务和入库系统一齐数据。

选拔DSG RealSync系统以往,复制指标端系统处王丽萍常的可用状态(称为“Active”),此时得以将一部分只读业务,如地市查询、报表计算、历史数据查询、收取数据、新系统一测试试等从主生产系统中迁移到查询系统上进展。那样,既能升高查询系统的利用率,又能缓慢化解主生产类其余压力。

 

2.九  湖南维埃社会主义共和国联盟通业务复制利用

  类型须求

西藏维埃社会主义共和国联盟通为知足其全省1200多万用户的业务量,完结话音和Internet业务的综合管理,建设了全县的汇总营帐系统。该连串在经过了较长一段实行的运营后,须要越来越优化系统结构以满意其更为的事情发展,首要包含:

(一)  如何加强综合资帐系统的周转质量,减弱综合资帐运转负荷;

(2)  如何提升系统查询和总结分析品质;怎么着满意地市天性化业务供给和事务2回开采

(3)  怎么着加强综合资帐与外部系统里面包车型地铁多寡接口效用

(四)  怎样进一步利用综合资帐数据实行数量开采、分析事情发展规律、开采事情难点、实行当务贰遍开采等;

(伍)  如何为联通统壹经营分析平台提供组成后的数目来自;

为此,广西维埃社会主义共和国缔盟通供给优化其集团音信体系平台。通过该架构,产生江西维埃社会主义共和国结盟通“第贰数据中央”,该数量主导首要担负了以下几类专门的职业:

(一)  提供VIP客户的飞跃业务管理成效,提供VIP客户的事体发展景观实时监察和控制和VIP客户的上游客户服务;

(2)  提供吉林维埃社会主义共和国结盟通帐务计算报表职业;

(三)  提供湖北维埃社会主义共和国联盟通系统接口平台;

在建设了该架构后,尼罗河维埃社会主义共和国联盟通的营帐和计费系统的压力获得了成立的分摊、提升了系统运维功用,缓慢解决了持续对营帐和计费系统进级带来的投资担当,升高了青海维埃社会主义共和国联盟通的系统布置灵活性。

 

  缓慢解决方案

DSG RealSync为青海维埃社会主义共和国结盟通的需要提供了最棒的缓和方案。

 澳门新浦京娱乐场网站 12

如图所示,系统使用DSGRealSync从计费系统、帐务系统中的钦定表的数额复制到四个独门的复制系统上。在单身的复制系统上用以数据查询、总结分析等。

  采纳效益

DSG RealSync在知足福建维埃社会主义共和国结盟通业务须求有着明显的特色:

  1. 一.  低沉查询系统存款和储蓄空间

提供选取性复制成效,所以对于查询系统来说,没有必要复制生产连串上的有着数据,从而收缩查询系统的仓库储存空间。

源系统上的数据水库蓄水体积量总共达到有多少个TB,而急需复制到查询系统上的数额唯有中间的十多张表,数据量约为几拾GB。那是运用磁盘镜像技巧所不能落得的。

  1. 贰.  满意品质指标

在能力所能达到提供逻辑复制作用的工具中,RealSync针对邮电通讯级伟大的职业务量数据所设计的,因而在质量上完全满意专门的职业系统的必要。

  1. 三.  可提供优化的询问系统

源数据库系统和目标数据库系统的可异构,重要归纳索引规则和仓库储存参数(如数据块大小、回滚段等)。由此得以在查询数据库上依照专业特点举行调节和优化,完全不受源系统的限定。

 

2.拾 台湾网通数据复制应用案例

  客户背景

新疆省通讯集团是受命湖南通讯业一百年发展历史的重型通讯集团,是湖南地区实力丰厚、品牌强劲的功底邮电通讯运维商。主要经营国际、国内每一种固定邮电通讯网络与器械(含本地有线环路),经营基于邮电通讯网络的夹枪带棍、数据、图像及多媒体通讯与音信服务职业,以及与通讯及新闻专门的工作有关的连串融为一体、本领开拓、才具服务、消息咨询、广告、通讯设施出售、设计施工等作业。

  品类供给

广东省通讯公司为了适应职业发展及日益激烈的商场竞争的须求,决定开采新一代邮电通信运行支撑连串。整个系统建设分别围绕利益,服务,管理八个核心分等第分步骤的拓展。

在类型进行的率先个阶段建设综述服务提供平台,联机收罗系统,综合职业计费帐务系统,综合买下账单系统,财富管理类别,交流网网管系统等系统,在以客户为骨干的欧洲经济共同体集团首席实施官思想的指导下,为化解连忙、有效和可控的服务提供与保险方面包车型大巴难题,综合服务提供平台成为第3品级建设的种类当中的机要。

里头总结分析事情在西藏网通的基本点显得10分优异,因为在当落实了省专门的工作支撑连串的汇总建设后,大批量的总计分析应用对系统提出了极高的渴求。由此湖北网通在省专业支撑中央决定建设贰个汇集的总括分析平台,该平台独立于各生产体系服务器,建设专用的总计分析系统,该系统全体独立的多少、服务器、大体量存款和储蓄和总计应用程序。并且计算分析系统稳步可进步为经营决策分析系统,

  系统景况

澳门新浦京娱乐场网站 13

如上图所示,必要DSG RealSync实行理并答复制的政工系统包罗六大类组成:

ü  计费系统:有两台IBM服务器组成HA架构,运行ORACLE 玖I数据库;

ü  营业收入系统:有两台服务器组成HA架构作为oracle数据库服务器,其余两台作为应用服务器(应用服务器不在复制范围之内)

ü  综和服务平台:有两台IBM服务器组成,运营ORACLE 玖I数据库;

ü  能源管理种类:有两台IBM服务器组成,运转ORACLE 九I数据;

ü  网间买单系统:有两台IBM服务器组成,运营ORACLE 玖I数据;

ü  网管系统:有两台IBM服务器组成,运维ORACLE 九I数据;

 

各系统的容积大小为:

业务模块

有效容量(TB)

营收+计费系统

13.00

网间结算系统

12.10

综合服务平台

4.80

交换网网管

3.60

资源管理

0.80

 

  不留余地方案

总括分析种类的独自,从根本上化解了总括分析与生育系统的财富争用难点,大批量的计算分析利用并不会潜移默化到生育系统的拍卖品质。那样壹方面能够增进总括分析的处理品质,进步总括分析的运作功效,也升高了生育体系的周转效能和健康程度。

由于当生产系统与计算分析系列相互独立,关键难题就在于如何落实总括分析系统上的数目更新,怎么着确定保证总计体周详据实时反映生产系统的事务转移。

DSG推出的实时数据库复制技能RealSync为那几个主题材料提供了很好的解决方案,该技艺对选定的数额对象开始展览复制,将那么些选定目的的退换复制到其它1个数据库实例作为报表、查询以及利用,系统异构,对生育系统的低干扰性,适合高速、精确要求。

 

DSG RealSync为广东网通解决了此难点,通过RealSync产品从生产系统中校要求提供计算分析功能的数量实时提取到总括分析平台上来,保存到计算分析的专用磁盘阵列,用于总括分析专门的学问。总括分析类别须求数据库在线,且分析数据要封存二年以上的利用数据。

如此那般经过RealSync将生育系统上产生的数额实时复制到计算分析种类上,有限扶助了总结分析数据的即时更新。消除了独立的六伟绩务连串的数据汇总整合难题,建设了凑集的计算分析系统,并为发展变成统一数据饭馆系统奠定了根基。

DSG RealSync在满足该连串必要上,存在以下几个特色:

ü  灵活的复制结构: 

澳门新浦京娱乐场网站,匡助N:一的复制,完成广西网通陆大分散业务系统的数目汇总和重组。

ü  按需复制: 

RealSync系统协理对点名新闻的按需复制,在方案中只必要复制内定系统中的关键业务数据,而对这一个中间结果和一时半刻数据则无需复制,减少总结平台供给的囤积体量。

ü  系统异构,可提供更加多的优化空间: 

对象连串与源系统可使用不一致的服务器和磁盘阵列,并且源数据库系统和目标数据库系统的可异构,首要包含索引规则等。

 

二.11 法国巴黎松江财政容灾系统使用案例

  事务必要

乘胜计算机应用种类的爆炸式发展,业务量神速扩充,业务品种日益复杂,系统必须管理持续增加的音信流量;随着音信量的熊熊增大,焦点数据的管制变得逐步辛勤。怎么样安全、可相信地囤积业务数据及满意现在思想政治工作数据火速拉长的须要;怎样有效管理日益增加的作业数据;怎么着兑现业务数据的共享并在存活事业数据之上创设新兴的增值应用,如数据旅舍、客户关系管理(C奥德赛M)等,成为了各厂商创设音信类别的关键所在。

因次香岛松江财政部门陈设建设叁个聚齐的多少大旨,将其所部属的连带单位的财政数据汇总搜罗到数码宗旨。通过募集过来的数目达成两类目标:

(一)     作为各单位首要数据的灾备中央;

通超过实际时复制的法子将各下属单位的重要财政数据上收到数量主导,当各系统能够因为灾荒产生职业终止或数额丢失时,可以在灾备中央进行作业接管和数据苏醒。

(贰)     创立数据旅馆平台;

透超过实际时复制的艺术将各下属单位的显要财政数据上收到数量主导,再从聚焦数据库中通过ETL工具抽出关注的业务数据进入数据旅社中,举行财政数据的辨析、汇总和数据开采。

  方案设计

一、1期建设范围 

1期将其属下的四个第贰的数据库进行上收。

ü  上收的数量包罗三个oracle数据库;

ü  共计约400个user下的多寡;

ü  数据量总共为几拾GB。

二、系统结构 

依靠财政中央职业系统的须求及其专门的学业特色,大家提出的系统结构图如下所示:

 澳门新浦京娱乐场网站 14

 

  化解方案特点

1、主备系统数据库处于双活状态 

东京财政系统数据同业务供给在复制链路中的各个数据库都地处活动状态,当中容灾数据库承担了多少容灾备份,在任何二个生产数据库产生劫难时索要立时提供工作的接管和及时的数据恢复,同时,灾备数据库一贯处于open状态,能够对灾备数据库举行实时访问,系统一保险证生产为主和灾备中央的数据库处于双激活状态;

推荐介绍消除方案接纳了DSG RealSync达成生产数量库源系统到容灾系统的复制专门的工作。能够从技艺上保险对象数据库在线可用,容灾数据库的多寡实时可读取,复制进度和多少读取不发生争辩。RealSync的复制延迟一点都不大,从容灾数据库读取到的数目是实时最新数据,没有须求为了读取到新型数据而进展局地切换专门的学业。

二、N:一的容灾架构,适合于聚集容灾的艺术 

DSG的容灾化解方案可实现异构系统下的N:壹容灾系统布局,可达成1套容灾系统对多套生产系统提供容灾服务,收缩为每套生产连串建设1套容灾系统方式下的高投入。

 

3、异构意况的容灾格局 

RealSync的容灾化解方案为用户提供的是依赖逻辑的多寡复制消除方案,因而对于地点系统和容灾系统来讲,其硬件平台能够属于分歧的商家、差别的型号,可采纳不一致的操作系统等。基于逻辑的多少复制屏蔽了底部物理数据的反差。

正如此案例,需求上收的系统分别使用了不相同的硬件配备,包蕴HP-UX,AIX,Linux等有使用。这么些类别所选择的硬件平台各区别。系统运用RealSync提供的异构容灾化解方案时方可挑选不一致的异构存款和储蓄平台作为容灾系统的贮存平台。

 

 

二.1二 辽宁联通计费系统容灾及查询平台利用

  1、项目供给

本工程供给对GSM计费系统上的多寡提供数据复制协理,提供容灾和计费数据查询功效。计费系统在线系统一保险留5 一的数目,容灾系统上只供给保存十二月(上3个月+当前月)的数量用于容灾和询问。

为了满足该供给,假设应用常用的磁盘镜像本领以来,那么将有多少个难点是力不从心有效消除的,恐怕说如果化解该难题的资金财产是12分昂贵的:

n  无法促成按需复制:

磁盘镜像不能够兑现按需容灾技术,即在计费系统中只供给提供1 八月多少的容灾爱护,而在生育系统上有伍 5月数据。磁盘镜像技能只可以对伍 1数目提供容灾复制,那样必然增加存款和储蓄容积叁倍以上。

n  容灾数据不可能完结有效的多寡查询成效:

与别的任何保管政策同样,对容灾系统来说,没有灾祸出现时,大家根本不能意识到容灾系统所起到的效劳,不大概回收容灾系统建设所需的多量投资。当未出现祸殃时,大家的容灾端系统总是处在空闲状态,开销大批量入股买来的系统根本相当的小概有效使用。那一个主题材料直接干扰着用户。

部分磁盘复制手艺厂家生产了BCV等才具以化解该数据复用难点,而该方案必要用户购买1倍的磁盘空间,并且数据还不可能实时访问。

就此,若是使用守旧硬盘复制技艺化解上述难点来讲,但就硬盘容积投资上讲就将浪费6倍的硬盘。

 

  2、DSG消除方案

DSG公司生产的RealSync容灾解决方案为该要求提供了超级的消除方案。

该本事与磁盘镜像本领的常有不一致在于,RealSync是在逻辑级,通过传输和运营数据库事务(Transaction),来促成生产类别的数量实时复制到容灾系统上的。

这般该软件可提供该品种必要中的五个重视帮助:

(壹)按需采纳复制:

是因为该软件是在逻辑等级复制,所以生产系统和容灾系统在数码管理方面能够应用差异的国策,如在生养系统上保存5+二月多少,而在容灾系统系统上只保留一 壹数额。

RealSync可钦赐只对眼前一个月和前一月的1+一数目开始展览复制。

(二)容灾数据库可提供数据实时访问,而没有供给额外的积攒投资

采用RealSync复制工夫,容灾站数据库系统一向处在张开状态,分化于磁盘镜像技艺中的容灾数据库系统在开始展览数据复制是不可用的。因此,在RealSync热容灾消除方案中,能够因此容灾系统为任何系统提供数据共享服务。如通过容灾系统为计费系统查询功能。

并且该功效还无需像BCV那样购置多1倍的积攒空间。

运用DSG RealSync达成山西联通计费系统容灾方案结构如下:

 澳门新浦京娱乐场网站 15

如上海体育场面所示:此番工程是应用DSGRealSync将GSM计费系统上的贰个RP8400和二个HP N四千上的四个数据库复制到3个容灾系统上。

n  使用RealSync完结计费系统数据表复制成效;

n  完成选拔性复制,只复制那三个急需容灾的数码,在本方案中正是1 八月的数额;

n  实现容灾系统上的数量只保存壹 7月多少的方案,在每月末,通过脚本按期施行的秘诀或人工操作的法门将前七个月的数额删除;

n  达成容灾系统的数据查询成效,当数码复制进度中,容灾端数据也能够提供外部查询功效。

 

2.一三 SnapAssure在xinjiang移动BOSS系统备份的应用

  中国际结盟通BOSS备份系统所面临的挑衅

以xinjiang移动为例:

甘休到200陆年岁末,xinjiang移动已经颇具超越200万的用户,xinjiang移动BOSS系统的主机以HP,IBM企业的产品为主,有少些的SUN集团的服务器。

xinjiang移动如今最首要的政工支撑系统蕴涵:C君越M系统、帐务系统、计费系统、综合买下账单系统、总括分析系统和客服系统等等。数据库系统总体利用Oracle,为了省去主机财富,Oracle数据库全部运作在非归档(No Archive Log)方式下。

 

xinjiang移动原有的备份系统是以磁带库备份为主,当中设有严重的难点和挑衅:

一)  BOSS系统的数据备份未有完好的备份战略

由于xinjiang移动BOSS系统中运用的Oracle数据库非归档格局,维护人士无法完结在线数据的热备份。方今,只可以以将器重的数据库表倒出成文件再备份到磁带库的艺术张开备份,那种方法必要进行大批量的手工业操作和人造干预。因而,在线数据以及本地备份数据的备份工效十分大概不高,备份下来的文本也无力回天张开版本的田管和决定,xinjiang移动还不能够不辱任务自动备份和高效处理。

 

二)  BOSS系统的数据备份未有进展异地保存

BOSS系统的数据开始展览的备份都以地面包车型客车备份。即从生育主机上把第2数据备份到本地的磁带库举行仓库储存,全体操作都在主导机室内实践。

鉴于xinjiang移动方今还尚无建设远程的容灾系统,备份数据也从不马到功成异地的保留。那么一旦产生横祸性的事故,磁带的读写品质低,在还原测试、介质访问管理方面都设极度;更首要的是,非归档方式下的Oracle无法实行在线的热备份,这种景观对xinjiang移动业务数据的平安构成了非常的大的恐吓。可知,xinjiang移动紧缺一套备份数据的各地爱慕方案。

3)  BOSS系统的数据备份不能定时推行复苏性的测试

BOSS系统的数据备份极小概定时施行复苏性的测试主要有以下八个原因:

l 未有丰硕的能源开始展览回复测试,那几个财富指的是十足的上升测试空间和还原测试用的主机。测试主机的操作系统必要与业务系统主机的操作系统一保险持一致、安装的数据库版本必要平等、同时物理卷和逻辑卷的布局也急需尽只怕保持的同样。

l 数据恢复生机测试时间过长,贫乏人手开始展览追踪视察,对于数据量相当大的C奔驰G级M、计费、经营分析等系统,举办三次恢复生机的测试必要十分长的光阴。大概须求二10个小时本事够过来完结,壹是出于现存的磁带速度太慢,纵然如今最快的磁带机LTO二能够达到的骨子里条件备份速度也仅在13-1伍MB/s左右,备份复苏的习性明显过低。二是因为数量的复原由三个复苏手续组成,除了全复苏以外还要做多少个增量的回涨,复苏手续烦琐也是还原时间过长的首要原由之壹。此外,对于某个多少库表的东山复起也非得透过全恢复生机后本领对数据表实行提取,所以部分数据的复苏测试专业要耗费时间越来越长。那也是无力回天进展还原测试的1个至关心尊崇要原因。

  DSG SnapAssure建设方案:

DSG SnapAssure为xinjiang移动提供了1体化的、有效的备份进级化解方案,BOSS系统中的主要模块都落实了在线、聚集、热备份的章程,如图:

 澳门新浦京娱乐场网站 16

  方案特点如下:

  1. 一.      帮助Oracle数据库非归档状态下的备份 

对xinjiang移动的装有重大数据库,在其Oracle的非归档方式下,完毕了众人首创的在线自动热备份,并达成了聚集执会调查总结局一备份处理和聚焦执会侦查总结局一恢复生机管理。

  1. 二.      完整的备份计谋 

BOSS系统数据是不行重大的,同时考虑到业务的接二连三性,这几个多少都须求在不停机的境况下实行在线数据备份。

备份战略设定如下:

l 以七日为备份周期,每周一举行一次数据库数据全量备份,其他每一日开始展览数量增量备份;

l 业务数据库增量数据备份运转时间设定在每日的夜间开始展览,避开张营业务繁忙的时节;

l 备份数据在磁盘上保存两周的版本,即多个全备和十二个增量备份。

  1. 三.      火速的回复 

系统补助壹TB数据库的完全苏醒时间在2-四钟头左右。

  1. 肆.      协理单表直接回复 

当生产系统因人工误操作而招致表数据丢失时,可从DSG SnapAssure备份系统上一向过来内定表的笔录。

  1. 5.      完成备份数据的可相信性验证,应对赛班斯法案的渴求 

定时进行备份数据的出山小草测试阐明,赛班斯法案须求每半年实行一遍。选择DSGSnapAssure后,可经过DSG的备份验证产品DSG SnapShare,将备份数据直接急忙打开,进行实用验证。那防止了在守旧方案中张开校验需求的全复苏,避开了人力物理财富的豁达消耗,包含苏醒测试的主机消耗、苏醒空间的损耗、系统管理员多量干活时间的成本等等。

 

 

三     容灾异构平台的经验

券商名称 

RealSync上线时间 

生产端主机 

容灾端主机 

交易系统名称 

版本号 

民族证券

2007-2

IBM P570 AIX5.3

Oracle10g RAC

HP DS580 LINUXAS4

ORACLE10g RAC

恒生集中交易系统3.0版

中原证券

2007-3

IBM P570 AIX5.3

Oracle10g RAC

HP DS580 LINUXAS4

ORACLE10g RAC

恒生集中交易系统3.0版

国联证券

2006-7

IBM P570 AIX5.3

Oracle9i RAC

HP RX4640 HP 11.23A

Oracle9i RAC

恒生集中交易系统3.0版

华泰证券

2006-3

IBM S80 AIX5.2

Oracle9I RAC

IBM S80 AIX5.2

Oracle9I

恒生集中交易系统3.0版

金通证券

2006-10

HP DS570

Oracle10g RAC

HP DS570

Oracle10g

恒生集中交易系统3.0版

银河证券

2006-11

IBM M80 AIX5.2

Oracle9I RAC

IBM M80 AIX5.2

Oracle9I

金证开放基金系统

长江证券

2007-1

IBM P570 AIX5.3

Oracle10g RAC

IBM P570 AIX5.3

Oracle10g

恒生集中交易系统2006版

四     质量目标占用参考

一、某邮电通讯集中计费系统异构平台成功案例:

生产端是两台HP的superdemo oracle玖i rac 使用emc的dmx连串阵列

容灾端1台IBM P690用作重伟大的事业务容灾接管,以及平常的询问和表格总结

项目

结果

生产端表空间容量

约2.7T

实际数据量

约1.5T

RealSync压缩传输量

约350G

首次同步导出时间

约5小时

首次同步过程中源端CPU占用

40%-50%

首次同步过程中源端内存占用

400M-600M

首次同步过程中目标端CPU占用

12%

首次同步过程中目标端内存占用

250M-300M

增量同步过程中源端CPU占用

3%-5%

增量同步过程中源端内存占用

500M左右

增量同步过程中目标端CPU占用

5%-7%

增量同步过程中目标端内存占用

300M左右

 

二、某政坛行当聚焦数据管理同步异构平台成功案例:

生产类别二台hp安腾rx8640 oracle9i rac

容灾端两台solaris oracle九i rac用作容灾以及平日供数据酒店收取数据利用。

项目

结果

生产端表空间容量

约900G

实际数据量

400G

RealSync压缩传输量

约100G

首次同步导出时间

约3小时

首次同步过程中源端CPU占用

约30%

首次同步过程中源端内存占用

300M-400M

首次同步过程中目标端CPU占用

17%

首次同步过程中目标端内存占用

250M-300M

增量同步过程中源端CPU占用

3%-5%

增量同步过程中源端内存占用

400M左右

增量同步过程中目标端CPU占用

5%-7%

增量同步过程中目标端内存占用

300M左右

 

3、某股票集中交易系统异构平台成功案例

源端两台IBM 570 oracle十g rac

容灾端本地①台以前用作生产系统的HP小型机oracle十g供客户实行数量的询问,同时检查检查复制数据的正确性。异地容灾端另1台此前用作生产类其他HP小型机oracle十g张开异地容灾。

项目

结果

生产端表空间容量

约200G

实际数据量

约80G

RealSync压缩传输量

约55G

首次同步导出时间

约40分钟

首次同步过程中源端CPU占用

约15%

首次同步过程中源端内存占用

200M左右

首次同步过程中目标端CPU占用

7%

首次同步过程中目标端内存占用

150M左右

增量同步过程中源端CPU占用

3%-5%

增量同步过程中源端内存占用

200M左右

增量同步过程中目标端CPU占用

5%-7%

增量同步过程中目标端内存占用

150M左右

本文由澳门新浦京娱乐场网站发布于服务器,转载请注明出处:Linux下的高可用性方案研究,如何在服务器在线模