2020-09-06 06:00发布
加入QQ群:457200227(SAP S4 HANA技术交流) 群内免费提供SAP练习系统(在群公告中)
你好
我有一个有关HANA的数据库,我想对这些数据使用机器学习。
我试图在SAP HANA上连接python,以便在运行python脚本时获得更好的性能。 但是,当我仅尝试执行head.collect()以获取1000行时,则需要花费大量时间来处理。在本地运行时,我可以更快地获取数据。
你能帮我吗?
谢谢
HANA数据框应该工作的方式是下推计算,而不是将数据提交到python运行时。 您可以对数据进行任何hana_ml支持的修改:
https://help.sap.com/doc/0172e3957b5946da85d3fde85ee8f33d/2.0.03/zh-CN/html/hana_ml.dataframe.html#hana_ml.dataframe.DataFrame < br>
您可以执行较小的.head(5).collect()语句以获取一些数据点以用于可视化目的,但您不应执行.collect()语句以获取所有 数据设置回Jupyter/Python,因为您想利用HANA数据库内功能。 就是说,一千行的选择不应该花那么长时间(我想这已经转化为前1000个选择)。 也许检查您的网络设置? python运行时和HANA是在同一网络中,还是经过多个VPN/桥接跃点?
最多设置5个标签!
HANA数据框应该工作的方式是下推计算,而不是将数据提交到python运行时。 您可以对数据进行任何hana_ml支持的修改:
https://help.sap.com/doc/0172e3957b5946da85d3fde85ee8f33d/2.0.03/zh-CN/html/hana_ml.dataframe.html#hana_ml.dataframe.DataFrame < br>
您可以执行较小的.head(5).collect()语句以获取一些数据点以用于可视化目的,但您不应执行.collect()语句以获取所有 数据设置回Jupyter/Python,因为您想利用HANA数据库内功能。 就是说,一千行的选择不应该花那么长时间(我想这已经转化为前1000个选择)。 也许检查您的网络设置? python运行时和HANA是在同一网络中,还是经过多个VPN/桥接跃点?
一周热门 更多>