2020-09-05 05:01发布
点击此处---> 群内免费提供SAP练习系统(在群公告中)加入QQ群:457200227(SAP S4 HANA技术交流) 群内免费提供SAP练习系统(在群公告中)嗨, 当我可以使用SAP HA... 显示全部
加入QQ群:457200227(SAP S4 HANA技术交流) 群内免费提供SAP练习系统(在群公告中)
嗨,
当我可以使用SAP HANA中的数据在Jupyter笔记本中开发模型时,典型的用例是什么?
我之所以问是因为我知道的大多数机器学习用例都具有wav,txt,csv等格式的数据或存储在数据湖中的数据,例如 Hadoop或来自IOT传感器的流数据。 HANA内存非常昂贵,因此将这些数据加载到HANA毫无意义。
您知道任何用例或类似情况吗? 有链接吗?
BR
罗伯特
Robert,
您是正确的,通常,如果您要处理大量数据,则不会将数据永久存储在HANA中。 我的意思是,从理论上讲,使用HANA NSE时,您甚至可以考虑这种可能性,因为使用NSE的数据现在位于磁盘而不是内存上(在这种情况下,HANA的行为类似于基于常规磁盘的,启用缓存的数据库),但是您的论点会 是因为您永远不会将大数据存储在专门用于ML的数据库中,并且最好与Data Lake一起使用,因为您可以使用Spark之类的东西来分发计算。
在内存数据库中,HANA是内存中的计算引擎(有趣的是,IMCE是HANA的许多早期内部名称之一)。 从本质上讲,这意味着您不必一定要将数据存储在HANA的内存中,但是您可以(并且应该在有效的情况下)利用HANA数据库内计算引擎来快速处理数据,即使数据是 没有存储在HANA中。 我正在写一个博客,我将很快发布有关NSE所做的一些测试以及带有hana_ml lib的虚拟表的信息
通常,HANA内存中计算的优势在于对来自SAP应用程序的实时数据进行评分。 这样,我们可以轻松地将模型投入实际的业务交易应用程序中。
最多设置5个标签!
Robert,
您是正确的,通常,如果您要处理大量数据,则不会将数据永久存储在HANA中。 我的意思是,从理论上讲,使用HANA NSE时,您甚至可以考虑这种可能性,因为使用NSE的数据现在位于磁盘而不是内存上(在这种情况下,HANA的行为类似于基于常规磁盘的,启用缓存的数据库),但是您的论点会 是因为您永远不会将大数据存储在专门用于ML的数据库中,并且最好与Data Lake一起使用,因为您可以使用Spark之类的东西来分发计算。
在内存数据库中,HANA是内存中的计算引擎(有趣的是,IMCE是HANA的许多早期内部名称之一)。 从本质上讲,这意味着您不必一定要将数据存储在HANA的内存中,但是您可以(并且应该在有效的情况下)利用HANA数据库内计算引擎来快速处理数据,即使数据是 没有存储在HANA中。 我正在写一个博客,我将很快发布有关NSE所做的一些测试以及带有hana_ml lib的虚拟表的信息
通常,HANA内存中计算的优势在于对来自SAP应用程序的实时数据进行评分。 这样,我们可以轻松地将模型投入实际的业务交易应用程序中。
一周热门 更多>