BODS中的Parquet文件格式

2020-09-06 09:29发布

         点击此处--->   EasySAP.com群内免费提供SAP练习系统(在群公告中)

加入QQ群:457200227(SAP S4 HANA技术交流) 群内免费提供SAP练习系统(在群公告中)


需要将数据从Amazon S3存储桶加载到HANA。 但是S3提供的文件格式是Parquet。 如何在BODS中为Parquet文件配置文件格式。

         点击此处--->   EasySAP.com群内免费提供SAP练习系统(在群公告中)

加入QQ群:457200227(SAP S4 HANA技术交流) 群内免费提供SAP练习系统(在群公告中)


需要将数据从Amazon S3存储桶加载到HANA。 但是S3提供的文件格式是Parquet。 如何在BODS中为Parquet文件配置文件格式。

付费偷看设置
发送
1条回答
nice_wp
1楼 · 2020-09-06 10:25.采纳回答

这有点超出我的舒适范围,但是在我看来

  • 您不能像这样读取Parquet文件
  • 您可以使用大数据连接并使用Hive/可以读取Parquet文件的Spark

https ://help.sap.com/viewer/af6d8e979d0f40c49175007e486257f0/4.2.12/zh-CN/5764a8566d6d1014b3fc9283b0e91070.html

虽然您的请求听起来很合理-我有一个镶木地板文件,但其中包含数据 和结构,因此读取它没有问题-但是,Apache Parquet库的实现方式不同。 它与Hadoop紧密结合在一起,而不是独立的文件格式。

但是即使如此,我仍然相信Data Services会通过Hive库读取该结构,而不是直接从Parquet中读取。 因此,您需要先在Hive中注册Parquet文件。...不是很方便。

如前所述,在我的舒适范围之外,希望我得到纠正。

一周热门 更多>