`
ntk006vz
  • 浏览: 12002 次
社区版块
存档分类
最新评论

关于HA的问题

 
阅读更多

关于HA的问题
2011年12月20日
  关于HA的问题今天不知怎么了,起HA时发生错误,小机上的Socket服务无法使用了,我很菜,请大家帮忙看看,感激不尽。小机为两台630做双机,系统为5.2,HA为5.1,A机上装DB2,B机上有Websphere和socket服务。A机、B机都连在一台3750交换机上,故障发生前一切正常,后是因为我的一个同事不小把交换机弄断电之后,没有做任何处理的情况下,又将交换机加电,导致B机down掉,后来我就将A机按正常的步骤关掉重启,A机也一切正常(包括HA),但在起B机的HA时,有两次当机,第三次是在做了Verify and Synchronize HACMP Configuration后,才将HA启动,但是B机上的socket服务却还是不可用,websphere却正常。在tail -f /tmp/hacmp.out窗口中看到有错误,信息如下:
  Jan 31 15:04:06 EVENT START: event_error 1 2_node_down WASServer graceful _2
  :event_error[52] [[ high = high ]]
  :event_error[52] version=1.10
  :event_error[53] :event_error[53] cl_get_path
  HA_DIR=es
  :event_error[55] EXIT_STATUS=1
  :event_error[56] RP_NAME=1 2_node_down WASServer graceful _2
  :event_error[59] [ 2 -ne 2 ]
  :event_error[65] set -u
  :event_error[67] RP_NAME=node_down WASServer graceful _2
  :event_error[68] RP_NAME=node_down WASServer graceful
  :event_error[70] :event_error[70] cllsclstr -c
  :event_error[70] grep -v cname
  :event_error[70] cut -d : -f2
  CLUSTER=tyyc
  :event_error[74] [ -x /usr/lpp/ssp/bin/spget_syspar ]
  :event_error[81] echo WARNING: Cluster tyyc Failed while running node_down WASServer graceful , exit status was 1
  :event_error[81] 1>; /dev/console
  :event_error[82] echo WARNING: Cluster tyyc Failed while running node_down WASServer graceful , exit status was 1
  WARNING: Cluster tyyc Failed while running node_down WASServer graceful , exit status was 1
  :event_error[88] [[ node_down WASServer graceful= reconfig_resource* ]]
  Jan 31 15:04:06 EVENT FAILED:-1: event_error 1 2_node_down WASServer graceful _2
  Jan 31 15:09:14 EVENT START: config_too_long 360 /usr/es/sbin/cluster/events/node_down.rp
  :config_too_long[64] [[ high = high ]]
  :config_too_long[64] version=1.11
  :config_too_long[65] :config_too_long[65] cl_get_path
  HA_DIR=es
  :config_too_long[67] NUM_SECS=360
  :config_too_long[68] EVENT=/usr/es/sbin/cluster/events/node_down.rp
  :config_too_long[70] HOUR=3600
  :config_too_long[71] THRESHOLD=5
  :config_too_long[72] SLEEP_INTERVAL=1
  :config_too_long[78] PERIOD=30
  :config_too_long[81] set -u
  :config_too_long[86] LOOPCNT=0
  :config_too_long[87] MESSAGECNT=0
  :config_too_long[88] :config_too_long[88] cllsclstr -c
  :config_too_long[88] grep -v cname
  :config_too_long[88] cut -d : -f2
  CLUSTER=tyyc
  :config_too_long[89] TIME=360
  :config_too_long[90] sleep_cntr=0
  :config_too_long[95] [ -x /usr/lpp/ssp/bin/spget_syspar ]
  WARNING: Cluster tyyc has been running recovery program '/usr/es/sbin/cluster/events/node_down.rp' for 360 seconds. Please check clu
  ster status.
  WARNING: Cluster tyyc has been running recovery program '/usr/es/sbin/cluster/events/node_down.rp' for 390 seconds. Please check clu
  ster status.
  WARNING: Cluster tyyc has been running recovery program '/usr/es/sbin/cluster/events/node_down.rp' for 420 seconds. Please check clu
  ster status.
  WARNING: Cluster tyyc has been running recovery program '/usr/es/sbin/cluster/events/node_down.rp' for 450 seconds. Please check clu
  ster status.
  WARNING: Cluster tyyc has been running recovery program '/usr/es/sbin/cluster/events/node_down.rp' for 480 seconds. Please check clu
  ster status.
  WARNING: Cluster tyyc has been running recovery program '/usr/es/sbin/cluster/events/node_down.rp' for 540 seconds. Please check clu
  ster status.
  WARNING: Cluster tyyc has been running recovery program '/usr/es/sbin/cluster/events/node_down.rp' for 600 second
  求助:请大家帮我看看这是什么问题?谢谢 s. Please check clu
  ster status.
  WARNING: Cluster tyyc has been running recovery program '/usr/es/sbin/cluster/events/node_down.rp' for 660 seconds. Please check clu
  ster status.
  WARNING: Cluster tyyc has been running recovery program '/usr/es/sbin/cluster/events/node_down.rp' for 720 seconds. Please check clu
  ster status.
  _________________________________
  我很菜http://www.airjordan6.net,需要你的帮助,谢谢!关于HA的问题你贴的哪台机器的hacmp.out?看起来hacmp在停的阶段碰到了问题,还没停下来呢。关于HA的问题是B机的,就是停不下来,只有在smitty clstop中用force方式才能停掉。但在hacmp.out中就有前贴所示之错;但重启机器后用命令lssrc -g cluster以及用
  /usr/sbin/cluster/clstat看到输出都正常。同步、校验都没有报错。请帮忙看看。谢谢!关于HA的问题系统里没有什么别的错误吗?资源都带起来了吗?
  把B的ha配置全删干净了再从A上运行同步试试。关于HA的问题我看了一下,资源在A、B中都已经起来了,但我想还是有问题,因为我的socket服务还是不能使用。
  把B的ha配置全删干净?那不是要在B上重新配过HA?
  我的环境是http://www.ccywm.com:A机跑DB2,B机跑websphere和socket,另外一台是MQ。
  谢谢回复!关于HA的问题把B的ha配置全删干净后你可以在A上同步!九牧王
  注:把B的ha配置全删干净指:smitty hacmp中讲你的cluster name删掉
  如果不行建议你打补丁
  aix的,还有hacmp的!关于HA的问题你的socket服务是作为app由HA带起来的?可以这样试试,先测不带应用的HA,再测不带HA的应用。
  也许本来就是socket服务有问题了,和HA无关
  
  
  
分享到:
评论

相关推荐

    ROSE HA 安装步骤

    ROSE HA官方使用手册,图文并茂,特别详细。 若有版权问题,请及时联系我,立马删除

    Linux for Oracle HA

    HA是一套提供防止业务主机因不可避免的意外性或计划性宕机问题的高可用性软件。ROSE HA软件同时安装在两台主机上,用于监视系统的状态,协调两台主机的工作,维护系统的可用性。它能侦测应用级系统软件、硬件发生的...

    VmWare_Esx_HA完整过程

    VMware HA为所有在虚拟机中运行的应用程序提供易于使用、经济高效的高可用性。当服务器发生故障时,受影响的虚拟机将在群集中留有备用容量的其他主机...今天在做HA的时候遇到了挺多问题的,所以就写下来让大家做个参考

    Hadoop HA 搭建(附问题解决方法)

    资源中具体对Hadoop HA平台搭建过程中出现的问题给出了相应的解决办法,图文结合,适合新手学习来用,如果遇到其他,欢迎交流学习

    ha457.jar 一个jump分析

    ha457jar一个jump分析,分析堆内存问题,可以看出哪个类占用比例高的问题

    自己总结的hadoop HA安装流程

    自己总结的hadoop HA安装流程。公司是按这个流程安装的。没问题

    天勤HA skygeha快速安装手册quick_install.pdf

    该文档很全面,HA所有用到的配置基本都有了。 当初安装HA时就是按照它来做的,这个看明白基本安装就没问题了。 初学HA或不熟悉安装和配置朋友,此书必备!

    Mysql HA 配置方法—masterslave模式

    Openstack中所有的组件均使用同一个mysql数据库,存在单点故障问题,如果mysql停止运行将影响整个云的稳定性;本文主要介绍如何构建基本的Mysql ha高可用环境,从而提高整个云的稳定性。

    opcua-HA-HE-DA-AC applications.rar

    软件包含了OPC UA,OPC HA/HE/AC的客户端和服务器,简单易用,资源中包含了一个本人自己编写的以OPC HA为例的详细环境搭建步骤,以及搭建环境过程中遇到的问题的解决方法

    HA_OllyDBG1

    经常是用原版来调试汉化版找问题,象原来菜单上的“&Window”汉化后会出错,还是调试后才知道原来它内部加载菜单时还有个这个“&Window”,只有两个都汉化才不会出错。另外其它的许多问题都只好靠调试来解决。原来...

    MySql HA.docx

    Mysql主从复制,MySQL读写分离(Mycat和ShardingJdbc两种方式),MySQL索引(数据结构和失效原因),MySqL性能优化(慢查询),MySQL分库分表(Mycay和ShardingJdbc),MySqL集群问题

    HA-Recuva_137

    这是一个免费的 Windows 平台下的文件恢复工具,它可以用来恢复那些被误删除的... 汉化版修正了官方版本中项目信息面板的中文字体显示不完整、过小或不完全的问题以及翻译不完整等问题。安装后直接运行即可正常使用。

    HA_OllyDBG.rar

    OllyDbg 是一种具有可视化界面的 32 位汇编-...它的特别之处在于可以在没有源代码时解决问题,并且可以处理其它编译器无法解决的难题。 附件是OllyDbg的免安装文件,直接就可以运行。非常方便调试和分析源代码所用。

    大数据技术之HadoopHA视频教程

    视频详细讲解,需要的小伙伴...你将通过本课程学习到,Hadoop存在的单点故障问题,解决单点故障的方案,搭建手动故障转移的HDFS-HA集群,搭建基于Zookeeper的自动故障转移的HDFS-HA集群以及自动故障转移的Yarn-HA集群。

    hadoop-2.7.2/4-ha-conf

    基本的ha部署配置配置,包含2.7.2版本与2.7.4版本配置,2.7.4采用默认配置修改而来,避免了nm无法启动和rm-web-ui外部无法访问的问题

    HA-eXeScope650-moming

    eXeScope 6.50 汉化版由 汉化...同时对原版程序作了一些修改,修正了中文输入法会自动关闭的问题,对一些对话框会使用用户所选字体也作了一定的调整,另外,还解决了脱掉 ASPack 等加壳软件的壳后文件无法打开的问题。

    HA_HW403_ljh汉化修正版

    汉化补丁:HA_HH403_ljh.exe 汉化大小:2459 kb 汉化作者:刘继华 汉化作者 E-mail: liujihua2003@yahoo.com.cn 软件简介: ﹌﹌﹌﹌  Microsoft 出的制作与编译 .HLP 帮助文件的老牌编译器。内含 Dialog Box Help...

    HA高可用分布式部署.pdf

    高可用(High Availability,HA)分布式部署是一种计算机系统或应用程序架构设计方法,旨在确保系统能够在面临硬件故障、软件错误或其他不可避免的问题时保持可用性和稳定性。这种部署方式通常用于关键性应用程序和...

    HA.PTGui.Pro.9.0.接图软件

    PTGui 9.0 的“笑脸”水印曾困扰了大家很久,经过一番的折腾之后, 今天总算是解决了这个问题,虽然没有很慎密的测试,但还是放出来, 效果让大家来评价!

    Newstartha进阶

    当集群软件newstart HA部署并上线后,后期维护变得既是重点也是难点,如何管理?出现问题如何处理?这对接触集群软件不深的维护人员来说是首要面对的难题.下面与大家一起深入了解newstart HA,解决这两难题。

Global site tag (gtag.js) - Google Analytics