SAP HANA python API-机器学习用例

2020-09-05 05:01发布

点击此处---> 群内免费提供SAP练习系统(在群公告中)加入QQ群:457200227(SAP S4 HANA技术交流) 群内免费提供SAP练习系统(在群公告中)嗨, 当我可以使用SAP HA...

         点击此处--->   EasySAP.com群内免费提供SAP练习系统(在群公告中)

加入QQ群:457200227(SAP S4 HANA技术交流) 群内免费提供SAP练习系统(在群公告中)


嗨,

当我可以使用SAP HANA中的数据在Jupyter笔记本中开发模型时,典型的用例是什么?

我之所以问是因为我知道的大多数机器学习用例都具有wav,txt,csv等格式的数据或存储在数据湖中的数据,例如 Hadoop或来自IOT传感器的流数据。 HANA内存非常昂贵,因此将这些数据加载到HANA毫无意义。

您知道任何用例或类似情况吗? 有链接吗?

BR

罗伯特

4条回答
SC_Yao
2020-09-05 05:39

您好罗伯特·安格伯格

SAP HANA Python API包含两个主要组件,一个是SAP HANA DataFrame,另一个是对APL和PAL算法包装的访问。

SAP HANA DataFrame使您可以访问SAP HANA 数据并在数据库中而不是在本地运行转换,则可以在数据库级别而不是本地应用转换,聚合和其他功能。

您还可以通过首选的可视化或ML库,像使用任何Pandas数据框一样最终收集数据。

第二个,您可以访问SAP HANA库 用于机器学习。 SAP HANA可以访问90多种"行业"标准算法,例如线性回归,K均值,Apriori等,还可以访问KXEN(APL)的自动算法。 野心!

有关PAL可用的算法列表,请检查: https://help.sap.com/doc/0172e3957b5946da85d3fde85ee8f33d/2.0.03/zh-CN/html/hana_ml.algorithms.pal.html

有关PAL可用的算法列表,请检查: https://help.sap.com/doc/0172e3957b5946da85d3fde85ee8f33d/2.0.03/zh-CN/html/hana_ml.algorithms.apl.html

您还可以查看有关SAP HANA Python库的 Arun Godwin Patel 博客系列:

- https://blogs.sap.com/2018/12/17/diving-into-the-hana-dataframe-python-integration-part-1/

- https://blogs.sap.com/2019/01/28/diving-into-the-hana-dataframe-python-integration-part-2/

您还可以考虑使用SAP HANA速成版,该版本使用免费的开发人员许可证,最多可使用32 GB的RAM。 我亲自进行了一些加载csv文件的测试,结果发现我的4GB数据文件中的一些已加载到数百MB中。

据我所知,SAP HANA速成版允许您使用SAP HANA流功能(不过待确认)。

最后但并非最不重要的一点是,对于SAP HANA,快速版是您可以获取二进制文件并在所需的任何位置安装或下载预构建的VM(假设主机在两种情况下均满足最低系统要求)或旋转 AWS,Google Cloud或Microsoft Azure上的新实例(此处的顺序仅为字母顺序,此处未显示首选项;-))。

希望这可以帮助您更好地看到好处。

当然,这当然是值得讨论的

@bdel

一周热门 更多>