SAP Hana Python

2020-09-06 06:00发布

         点击此处--->   EasySAP.com群内免费提供SAP练习系统(在群公告中)

加入QQ群:457200227(SAP S4 HANA技术交流) 群内免费提供SAP练习系统(在群公告中)


你好

我有一个有关HANA的数据库,我想对这些数据使用机器学习。

我试图在SAP HANA上连接python,以便在运行python脚本时获得更好的性能。 但是,当我仅尝试执行head.collect()以获取1000行时,则需要花费大量时间来处理。在本地运行时,我可以更快地获取数据。

你能帮我吗?

谢谢

         点击此处--->   EasySAP.com群内免费提供SAP练习系统(在群公告中)

加入QQ群:457200227(SAP S4 HANA技术交流) 群内免费提供SAP练习系统(在群公告中)


你好

我有一个有关HANA的数据库,我想对这些数据使用机器学习。

我试图在SAP HANA上连接python,以便在运行python脚本时获得更好的性能。 但是,当我仅尝试执行head.collect()以获取1000行时,则需要花费大量时间来处理。在本地运行时,我可以更快地获取数据。

你能帮我吗?

谢谢

付费偷看设置
发送
1条回答
ZJXianG
1楼 · 2020-09-06 06:50.采纳回答

HANA数据框应该工作的方式是下推计算,而不是将数据提交到python运行时。 您可以对数据进行任何hana_ml支持的修改:

https://help.sap.com/doc/0172e3957b5946da85d3fde85ee8f33d/2.0.03/zh-CN/html/hana_ml.dataframe.html#hana_ml.dataframe.DataFrame < br>

您可以执行较小的.head(5).collect()语句以获取一些数据点以用于可视化目的,但您不应执行.collect()语句以获取所有 数据设置回Jupyter/Python,因为您想利用HANA数据库内功能。 就是说,一千行的选择不应该花那么长时间(我想这已经转化为前1000个选择)。 也许检查您的网络设置? python运行时和HANA是在同一网络中,还是经过多个VPN/桥接跃点?

一周热门 更多>