点击此处---> 群内免费提供SAP练习系统(在群公告中)
加入QQ群:457200227(SAP S4 HANA技术交流) 群内免费提供SAP练习系统(在群公告中)
症状:
- 从周日上午5:30开始,直到我在上午11点重新启动群集中的所有节点为止,所有计划的报告均失败,并出现以下错误:无法执行操作。
观察
:- CMC中的所有服务器都处于绿色运行状态。
- 用户仍然可以登录平台并刷新报告
发现:
在寻找根本原因时,这就是我所发现的。- CMS数据库位于SQL Server 2016上。
- SQL Server参与了高可用性组
- 上午5:16,此可用性组发生故障。 主节点从正常运行到解决再到挂起,最后又恢复正常。 这一切都在几秒钟之内发生,但是SQL Server确实关闭了所有连接。
- SQL Server AlwaysOn租约超时已过期
- 按预期,我在CMS日志中看到此错误:SAP BusinessObjects BI平台CMS:丢失了与" BOE CMS Repo"的CMS系统数据库连接。
- SAP BusinessObjects BI平台CMS:无法连接到CMS系统数据库" BOE CMS Repo"。 原因:[Microsoft] [ODBC SQL Server驱动程序] [SQL Server]由于数据库副本不是PRIMARY或SECONDARY角色而无法访问可用性数据库'BOE_CMS_Repository'。 仅当数据库副本处于PRIMARY或SECONDARY角色时,才允许连接到可用性数据库。 稍后重试该操作。
- 这是一个分布式环境,其中:a)一个节点上的CMS/FRS,b)第二个节点上的处理/webi。
- 环境也是群集的。
- 其他节点记录到它们失去了与CMS的连接:Server Intelligence Agent已失去与CMS群集的连接,但将继续尝试重新连接。 请验证群集中的CMS是否正在运行。
- FRS还会在事件日志中引发错误:传输错误:未知错误。
- 但是,同样根据日志,CMS很快在5:18:55 AM之前重新恢复了与SQL Server的连接。
- 此外,其他节点重新建立了与CMS的连接:Server Intelligence Agent已在 msp-bicms02.teamasp.myteamasp.com :6400-上午5:18:55。
- 所有服务器上的日志级别在CMC中均设置为"无"。 德拉特! :(
- 即使处理节点在凌晨5:18恢复了连接,我也确实在Windows Event Log 3中看到了凌晨5:20和5:24之间的错误:EventID 34700,BusinessObjects_WIReportServer,传输错误:无效的对象引用。EventID34700,BusinessObjects_ConnectionServer ,传输错误:无效的对象引用。,EventID 34700,BusinessObjects_ConnectionServer32,传输错误:无效的对象引用。 事件日志中没有其他错误。 (我希望作业按计划运行时,由于我没有打开跟踪,所以会产生事件日志错误)...
根本原因:
- SQL Server租约超时到期,并导致可用性组出现错误。 我们需要解决这个问题。
问题:
- 即使BI平台表明已恢复所有连接并且所有服务器都在CMC中列为绿色健康状态,但为何平台仍无法在计划的报告上继续失败?
- 为什么要重新启动服务器节点才能使AJS再次正常工作?
理想情况下,我需要在单独的环境中复制此问题,并确定哪个服务未成功重新连接,并向平台开放支持案例,因为此缺陷需要在平台中解决。 但是我什至不知道从哪里开始。 恢复连接后,平台需要从连接断开的状态中更好地恢复。 也许它特定于一个不受信任的平台,并且如果所有服务都在一个盒子上运行,也许就不会有问题吗?
您好,Brian,
理想的CMS,AJS不应回收,它应该始终处于运行或启用模式,在您的情况下,由于连接问题以及由于CMS影响整个环境,CMS应该被回收。 ,请您与网络团队进行协调,并检查是否存在任何网络延迟或连接问题,因为在重新启动/重新启动服务后,一切看起来都很好。
根据您的评论,其SAP 2之间的网络或连接问题 对象服务器,共享路径和数据库。
事件查看器日志中的警告/错误消息:-FRS还会在事件日志中引发错误:传输错误:未知错误。
关于您的 以下查询是更新:-
答复:-很难指出特定的服务,要求您共享日志以进行进一步分析,如果CMS重新启动或停止状态肯定会导致该节点上的作业失败。
回复:-不需要重新引导,理想情况下,您必须终止过时的会话 AJS和其他服务可以在SAP Business Objects服务的任务管理器中查看状态并手动启动服务,但是仍然需要检查以上几点以进行永久修复。
注意
达亚·贾(Daya Jha)
感谢您抽出宝贵的时间查看我的问题!! 我真的很感激!!
我不确定是否很清楚,但是CMS和SQL数据库之间的连接仅断开了大约40秒钟,并且即使根据SIA日志也可以快速恢复。 在这40秒钟之外,CMC服务器页面看起来不错,每个服务都已启动并重新连接并呈绿色亮起。 除了在40秒钟之内(CMS已正确捕获)之外,没有延迟问题/网络问题。
但是,计划的报告作业仍然失败。
计划的报告的修复程序是重新启动服务。 理想情况下,不必这样做。 如果CMS重新正确连接,则该平台应能够自行处理终止过时的会话等。
但是,我要寻找的是为什么/如何在恢复连接后作业失败并且服务没有完全恢复。
听起来您提供的答案是,当CMS失去连接时,它可能已在服务器上运行过时的AJS会话,而当CMS发出shutdown services命令时,BI平台无法正确关闭?
是的,您必须终止过时的会话,但是需要检查CMS(中央管理服务器)PID每天都在变化,如果是,则请与网络团队联系,因为理想情况下,它不应更改 直到重新启动服务器或手动重新启动为止。
关于清除陈旧会话是必需的,但是请您分享作业失败的错误消息以了解失败的原因。
< p>致意达亚·贾(Daya Jha)
我不确定这个答案有多重要。 我无法理解您的工作方向。
CMS数据库关闭了40秒。 一度。 不是每天都不会重复。 只是一次。
BI平台重新连接就好。 没有迹象表明会议过时。 您如何识别陈旧的会话?
否,我没有共享错误的详细信息,因为我没有打开跟踪。 我已经提到了这一点。 在我的原始问题中,症状下列出了作业输出引发的错误。
感谢您的澄清,请问是否可以在事件查看器中检查文件存储库错误消息(如果是连续的) 然后与网络团队联系。
还要过时地检查任务管理器和CMC中存在的PID是否相同(如果不相同),然后手动将其杀死。
关于
Daya Jha
嗨Daya-关于我的发现项目#10,在事件查看器中发现FRS传输错误...这些错误不是连续的。 仅在失去连接的那一刻。
一周热门 更多>