为什么在备份复制过程中会发生HANA数据库断开连接?

2020-09-20 09:03发布

         点击此处--->   EasySAP.com群内免费提供SAP练习系统(在群公告中)

加入QQ群:457200227(SAP S4 HANA技术交流) 群内免费提供SAP练习系统(在群公告中)


我们在HANA 1.00.122.12 VM SLES上以ECC 6.0 EHP 7 Suite运行。 我们还复制到备份数据库以用于灾难恢复。 在非工作时间,我们将数据库备份到磁盘,然后复制到另一个存储位置以进行最终备份。 在复制(CP命令)过程中,CPU和内存频繁升级。 不幸的是,几乎每天都在同一时间,数据库暂时断开。 结果,在此期间运行的任何作业都会失败。indexserver跟踪文件通常报告超时和连接断开,但并非总是如此。 SM21显示作业失败,但每天显示不同的作业。 这是一个多月前开始的(APR 3),但我们无法将其与系统环境中发生的任何更改相关联。我们已经检查了VM,网络,系统,备份,HANA和存储统计信息,并具有运行跟踪。 我们已经打开了与SAP的事件,但所有这些都没有答案,有人遇到相同或相似的情况吗?

         点击此处--->   EasySAP.com群内免费提供SAP练习系统(在群公告中)

加入QQ群:457200227(SAP S4 HANA技术交流) 群内免费提供SAP练习系统(在群公告中)


我们在HANA 1.00.122.12 VM SLES上以ECC 6.0 EHP 7 Suite运行。 我们还复制到备份数据库以用于灾难恢复。 在非工作时间,我们将数据库备份到磁盘,然后复制到另一个存储位置以进行最终备份。 在复制(CP命令)过程中,CPU和内存频繁升级。 不幸的是,几乎每天都在同一时间,数据库暂时断开。 结果,在此期间运行的任何作业都会失败。indexserver跟踪文件通常报告超时和连接断开,但并非总是如此。 SM21显示作业失败,但每天显示不同的作业。 这是一个多月前开始的(APR 3),但我们无法将其与系统环境中发生的任何更改相关联。我们已经检查了VM,网络,系统,备份,HANA和存储统计信息,并具有运行跟踪。 我们已经打开了与SAP的事件,但所有这些都没有答案,有人遇到相同或相似的情况吗?
付费偷看设置
发送
3条回答
xfwsx85
1楼-- · 2020-09-20 09:29

您已完成所有跟踪,但是您从中学到了什么?

是否有任何错误消息指出了断开连接的原因?

复制过程中的内存"升级"情况如何? 为什么会这样呢? 复制文件时是否使用DirectIO? 如果没有,则应考虑这一点,因为在一次性备份文件时使用文件缓冲存储器是没有好处的。

一只江湖小虾
2楼-- · 2020-09-20 09:54

我们不使用samba共享。 通过进一步测试,我们确定该副本未引起此问题。 我们同意您的声明。 我们已经记录到,升级之前正在运行且未对其进行更改的特定作业与明显的常规峰值相关。

我添加了一张图像,以提供HANA数据库操作之前/之后的生动场面。 hana-spiking-2 .png 同样,寻求帮助的要点是确定HANA为什么会(在任何时候)承认需求增加的连接丢失的原因。 我们已经更改了HANA参数,例如tcp_backlog和indexserver maxchannels,但是没有看到任何确定的结果。

我们将继续寻找答案。 谢谢。

Climb_Ma
3楼-- · 2020-09-20 09:33

嗨,拉斯。 这是DBA与Mark一起工作的Gary Conn。

简而言之,如果我们知道您问题的答案,我们就不会在这里。 那就是...

自从HANA从85.03升级到122.12以来,我们一直在半定期地获得小内存"峰值",在升级HANA之前我们没有得到它们。 我们正在等待SAP提供帮助,但到目前为止,没有任何帮助。 我们已根据要求向他们发送了跟踪和RTE文件,但他们未找到任何"吸烟枪"。 另外,当我们运行数据库备份时,内存和CPU会产生峰值。 当我们将备份移到另一个时间时,它随之而来。 我们使用HANA本机备份进行本地磁盘备份,然后使用非常基本的Linux cp命令将400 + GB(总大小)文件复制到用于存储备份的Windows服务器(然后从那里复制到磁带) 。 在过去的2.5年中,我们一直在这样做,直到现在。 在HANA备份和复制命令(进入cp命令大约40分钟)后发生内存和CPU高峰,并在大约10-15分钟后停止(内存增加大约20%后恢复正常); 复制到Windows服务器大约需要1.5个小时。 我们的HANA同步系统复制也通过10GB管道运行到本地站点; 首先使用新的logreplay,然后切换到delta_datashipping; 我正在尝试查看HSSR的不同模式是否导致峰值(仍在起作用)。

您或您认识的其他人以前经历过此事吗?

有想法吗?

谢谢。

加里·康恩

一周热门 更多>