- 浏览: 12002 次
最新评论
关于HA的问题
2011年12月20日
关于HA的问题今天不知怎么了,起HA时发生错误,小机上的Socket服务无法使用了,我很菜,请大家帮忙看看,感激不尽。小机为两台630做双机,系统为5.2,HA为5.1,A机上装DB2,B机上有Websphere和socket服务。A机、B机都连在一台3750交换机上,故障发生前一切正常,后是因为我的一个同事不小把交换机弄断电之后,没有做任何处理的情况下,又将交换机加电,导致B机down掉,后来我就将A机按正常的步骤关掉重启,A机也一切正常(包括HA),但在起B机的HA时,有两次当机,第三次是在做了Verify and Synchronize HACMP Configuration后,才将HA启动,但是B机上的socket服务却还是不可用,websphere却正常。在tail -f /tmp/hacmp.out窗口中看到有错误,信息如下:
Jan 31 15:04:06 EVENT START: event_error 1 2_node_down WASServer graceful _2
:event_error[52] [[ high = high ]]
:event_error[52] version=1.10
:event_error[53] :event_error[53] cl_get_path
HA_DIR=es
:event_error[55] EXIT_STATUS=1
:event_error[56] RP_NAME=1 2_node_down WASServer graceful _2
:event_error[59] [ 2 -ne 2 ]
:event_error[65] set -u
:event_error[67] RP_NAME=node_down WASServer graceful _2
:event_error[68] RP_NAME=node_down WASServer graceful
:event_error[70] :event_error[70] cllsclstr -c
:event_error[70] grep -v cname
:event_error[70] cut -d : -f2
CLUSTER=tyyc
:event_error[74] [ -x /usr/lpp/ssp/bin/spget_syspar ]
:event_error[81] echo WARNING: Cluster tyyc Failed while running node_down WASServer graceful , exit status was 1
:event_error[81] 1>; /dev/console
:event_error[82] echo WARNING: Cluster tyyc Failed while running node_down WASServer graceful , exit status was 1
WARNING: Cluster tyyc Failed while running node_down WASServer graceful , exit status was 1
:event_error[88] [[ node_down WASServer graceful= reconfig_resource* ]]
Jan 31 15:04:06 EVENT FAILED:-1: event_error 1 2_node_down WASServer graceful _2
Jan 31 15:09:14 EVENT START: config_too_long 360 /usr/es/sbin/cluster/events/node_down.rp
:config_too_long[64] [[ high = high ]]
:config_too_long[64] version=1.11
:config_too_long[65] :config_too_long[65] cl_get_path
HA_DIR=es
:config_too_long[67] NUM_SECS=360
:config_too_long[68] EVENT=/usr/es/sbin/cluster/events/node_down.rp
:config_too_long[70] HOUR=3600
:config_too_long[71] THRESHOLD=5
:config_too_long[72] SLEEP_INTERVAL=1
:config_too_long[78] PERIOD=30
:config_too_long[81] set -u
:config_too_long[86] LOOPCNT=0
:config_too_long[87] MESSAGECNT=0
:config_too_long[88] :config_too_long[88] cllsclstr -c
:config_too_long[88] grep -v cname
:config_too_long[88] cut -d : -f2
CLUSTER=tyyc
:config_too_long[89] TIME=360
:config_too_long[90] sleep_cntr=0
:config_too_long[95] [ -x /usr/lpp/ssp/bin/spget_syspar ]
WARNING: Cluster tyyc has been running recovery program '/usr/es/sbin/cluster/events/node_down.rp' for 360 seconds. Please check clu
ster status.
WARNING: Cluster tyyc has been running recovery program '/usr/es/sbin/cluster/events/node_down.rp' for 390 seconds. Please check clu
ster status.
WARNING: Cluster tyyc has been running recovery program '/usr/es/sbin/cluster/events/node_down.rp' for 420 seconds. Please check clu
ster status.
WARNING: Cluster tyyc has been running recovery program '/usr/es/sbin/cluster/events/node_down.rp' for 450 seconds. Please check clu
ster status.
WARNING: Cluster tyyc has been running recovery program '/usr/es/sbin/cluster/events/node_down.rp' for 480 seconds. Please check clu
ster status.
WARNING: Cluster tyyc has been running recovery program '/usr/es/sbin/cluster/events/node_down.rp' for 540 seconds. Please check clu
ster status.
WARNING: Cluster tyyc has been running recovery program '/usr/es/sbin/cluster/events/node_down.rp' for 600 second
求助:请大家帮我看看这是什么问题?谢谢 s. Please check clu
ster status.
WARNING: Cluster tyyc has been running recovery program '/usr/es/sbin/cluster/events/node_down.rp' for 660 seconds. Please check clu
ster status.
WARNING: Cluster tyyc has been running recovery program '/usr/es/sbin/cluster/events/node_down.rp' for 720 seconds. Please check clu
ster status.
_________________________________
我很菜http://www.airjordan6.net,需要你的帮助,谢谢!关于HA的问题你贴的哪台机器的hacmp.out?看起来hacmp在停的阶段碰到了问题,还没停下来呢。关于HA的问题是B机的,就是停不下来,只有在smitty clstop中用force方式才能停掉。但在hacmp.out中就有前贴所示之错;但重启机器后用命令lssrc -g cluster以及用
/usr/sbin/cluster/clstat看到输出都正常。同步、校验都没有报错。请帮忙看看。谢谢!关于HA的问题系统里没有什么别的错误吗?资源都带起来了吗?
把B的ha配置全删干净了再从A上运行同步试试。关于HA的问题我看了一下,资源在A、B中都已经起来了,但我想还是有问题,因为我的socket服务还是不能使用。
把B的ha配置全删干净?那不是要在B上重新配过HA?
我的环境是http://www.ccywm.com:A机跑DB2,B机跑websphere和socket,另外一台是MQ。
谢谢回复!关于HA的问题把B的ha配置全删干净后你可以在A上同步!九牧王
注:把B的ha配置全删干净指:smitty hacmp中讲你的cluster name删掉
如果不行建议你打补丁
aix的,还有hacmp的!关于HA的问题你的socket服务是作为app由HA带起来的?可以这样试试,先测不带应用的HA,再测不带HA的应用。
也许本来就是socket服务有问题了,和HA无关
发表评论
-
高考最常见易错语法题3(再次复习巩固类似题目)
2012-01-20 11:07 1146高考最常见易错语法题3(再次复习巩固类似题目) 15小时前 ... -
杭十四中2011-2012学年第一学期期末高一语文试卷
2012-01-20 11:07 597杭十四中2011-2012学年第一学期期末高一语文试卷 2小 ... -
Hibernate HQL与原生SQL
2012-01-20 11:07 781Hibernate HQL与原生SQL 2012年01月19 ... -
樱花带来的奇迹 D.C.P.C.(完全剧透)(三)
2012-01-20 11:07 1120樱花带来的奇迹 D.C.P.C.(完全剧透)(三) 20 ... -
php_study日记:异常处理
2012-01-19 16:00 596php_study日记:异常处理 2011年12月21日 ... -
[OpenSSL示例]HTTPS中间人攻击
2012-01-19 16:00 641[OpenSSL示例]HTTPS中间人攻击 2011年12月 ... -
Understanding the 3G-324M Spec
2012-01-19 16:00 412Understanding the 3G-324M Spec ... -
2011-12-16
2012-01-19 16:00 6962011-12-16 2011年12月16日 part ... -
三年级如何写作文
2012-01-17 05:52 601三年级如何写作文 2011年10月27日 三年级如何写 ... -
大全【极有收藏价值的】
2012-01-17 05:52 509大全【极有收藏价值的 ... -
提高小学作文实效性的思考
2012-01-17 05:52 543提高小学作文实效性的思考 2010年11月17日 摘要: ... -
小学生评语大全
2012-01-17 05:52 667小学生评语大全 2011年07月14日 你是一位可爱的小 ... -
小学生期末评语经典大全
2012-01-17 05:52 569小学生期末评语经典大全 2011年12月15日 1.你是 ... -
【转】浅谈温岭民间的孝文化
2012-01-16 04:38 753【转】浅谈温岭民间的孝文化 7小时前 作者:项琳冰 ... -
《论语》解读之3-26《无礼之状乱不忍观》
2012-01-16 04:38 566《论语》解读之3-26《无礼之状乱不忍观》 2012年01月 ... -
龙游子教练分享儒佛修身之道(六)
2012-01-16 04:38 805龙游子教练分享儒佛修 ...
相关推荐
ROSE HA官方使用手册,图文并茂,特别详细。 若有版权问题,请及时联系我,立马删除
HA是一套提供防止业务主机因不可避免的意外性或计划性宕机问题的高可用性软件。ROSE HA软件同时安装在两台主机上,用于监视系统的状态,协调两台主机的工作,维护系统的可用性。它能侦测应用级系统软件、硬件发生的...
VMware HA为所有在虚拟机中运行的应用程序提供易于使用、经济高效的高可用性。当服务器发生故障时,受影响的虚拟机将在群集中留有备用容量的其他主机...今天在做HA的时候遇到了挺多问题的,所以就写下来让大家做个参考
资源中具体对Hadoop HA平台搭建过程中出现的问题给出了相应的解决办法,图文结合,适合新手学习来用,如果遇到其他,欢迎交流学习
ha457jar一个jump分析,分析堆内存问题,可以看出哪个类占用比例高的问题
自己总结的hadoop HA安装流程。公司是按这个流程安装的。没问题
该文档很全面,HA所有用到的配置基本都有了。 当初安装HA时就是按照它来做的,这个看明白基本安装就没问题了。 初学HA或不熟悉安装和配置朋友,此书必备!
Openstack中所有的组件均使用同一个mysql数据库,存在单点故障问题,如果mysql停止运行将影响整个云的稳定性;本文主要介绍如何构建基本的Mysql ha高可用环境,从而提高整个云的稳定性。
软件包含了OPC UA,OPC HA/HE/AC的客户端和服务器,简单易用,资源中包含了一个本人自己编写的以OPC HA为例的详细环境搭建步骤,以及搭建环境过程中遇到的问题的解决方法
经常是用原版来调试汉化版找问题,象原来菜单上的“&Window”汉化后会出错,还是调试后才知道原来它内部加载菜单时还有个这个“&Window”,只有两个都汉化才不会出错。另外其它的许多问题都只好靠调试来解决。原来...
Mysql主从复制,MySQL读写分离(Mycat和ShardingJdbc两种方式),MySQL索引(数据结构和失效原因),MySqL性能优化(慢查询),MySQL分库分表(Mycay和ShardingJdbc),MySqL集群问题
这是一个免费的 Windows 平台下的文件恢复工具,它可以用来恢复那些被误删除的... 汉化版修正了官方版本中项目信息面板的中文字体显示不完整、过小或不完全的问题以及翻译不完整等问题。安装后直接运行即可正常使用。
OllyDbg 是一种具有可视化界面的 32 位汇编-...它的特别之处在于可以在没有源代码时解决问题,并且可以处理其它编译器无法解决的难题。 附件是OllyDbg的免安装文件,直接就可以运行。非常方便调试和分析源代码所用。
视频详细讲解,需要的小伙伴...你将通过本课程学习到,Hadoop存在的单点故障问题,解决单点故障的方案,搭建手动故障转移的HDFS-HA集群,搭建基于Zookeeper的自动故障转移的HDFS-HA集群以及自动故障转移的Yarn-HA集群。
基本的ha部署配置配置,包含2.7.2版本与2.7.4版本配置,2.7.4采用默认配置修改而来,避免了nm无法启动和rm-web-ui外部无法访问的问题
eXeScope 6.50 汉化版由 汉化...同时对原版程序作了一些修改,修正了中文输入法会自动关闭的问题,对一些对话框会使用用户所选字体也作了一定的调整,另外,还解决了脱掉 ASPack 等加壳软件的壳后文件无法打开的问题。
汉化补丁:HA_HH403_ljh.exe 汉化大小:2459 kb 汉化作者:刘继华 汉化作者 E-mail: liujihua2003@yahoo.com.cn 软件简介: ﹌﹌﹌﹌ Microsoft 出的制作与编译 .HLP 帮助文件的老牌编译器。内含 Dialog Box Help...
高可用(High Availability,HA)分布式部署是一种计算机系统或应用程序架构设计方法,旨在确保系统能够在面临硬件故障、软件错误或其他不可避免的问题时保持可用性和稳定性。这种部署方式通常用于关键性应用程序和...
PTGui 9.0 的“笑脸”水印曾困扰了大家很久,经过一番的折腾之后, 今天总算是解决了这个问题,虽然没有很慎密的测试,但还是放出来, 效果让大家来评价!
当集群软件newstart HA部署并上线后,后期维护变得既是重点也是难点,如何管理?出现问题如何处理?这对接触集群软件不深的维护人员来说是首要面对的难题.下面与大家一起深入了解newstart HA,解决这两难题。