将数据从BW/HANA传输到Azure DataLake时的性能问题-奄奄一息的小鱼的回答

将数据从BW/HANA传输到Azure DataLake时的性能问题

2020-08-14 14:00发布

4条回答

2020-08-14 14:23

感谢 Witalij Rudnicki ，请查看我的回复

我们正在从HANA计算视图（6个投影结合在一起）读取175列具有300万条记录的数据

Q1：您是否进行了其他任何调查，将总时间分解成几个部分，例如在HANA中选择数据，传输数据量，将其保存到int数据湖中？

是的，这些运行时用于将数据从HANA CV加载到Azure Data Lake，我们尝试使用默认参数，耗时约1小时，而在更改SSIS参数（引擎线程，批处理大小，缓冲区大小..）后，它没有运行时间明显减少

Q2：数据卷在Azure中保留后的大小是多少？

我们正在从HANA简历中读取175列，具有300万条记录

问题3：您是否尝试过并行化数据移动以创建多个流来读取HANA中的数据分区？

已尝试通过更改SSIS包和Azure Data Factory V2在Azure端进行参数更改以实现并行化，但这没有帮助。我可以尝试创建一个具有分区的临时表，并从CV加载数据以检查情况是否有所改善，但这将意味着在将数据从HANA运送到Azure之前需要执行额外的步骤！

谢谢

Abhishek尚博格

将数据从BW/HANA传输到Azure DataLake时的性能问题