从PDF获取数据

2020-08-24 13:34发布

点击此处---> 群内免费提供SAP练习系统(在群公告中)加入QQ群:457200227(SAP S4 HANA技术交流) 群内免费提供SAP练习系统(在群公告中)你好 由于宣布了社会保障,...

         点击此处--->   EasySAP.com群内免费提供SAP练习系统(在群公告中)

加入QQ群:457200227(SAP S4 HANA技术交流) 群内免费提供SAP练习系统(在群公告中)


你好

由于宣布了社会保障,我们从联邦政府那里得到了一些PDF文件。

我们必须将这些文件连接到相应的人员编号。 可以在PDF文件中找到该编号。

有人可以告诉我们如何在PDF中自动检测该数字吗? 我们如何在ABAP程序中读取这些"非结构化"数据?

该文档不是SAP提供的交互式Adobe表单的结果。

感谢您的帮助。

克里斯

2016年8月1日15-37-44.jpg (71.8 kB)
10条回答
wang628962
2020-08-24 14:05

Hi Kris,

Matthew 是正确的,PI中没有内置的PDF到文本转换器。 但是,有一些开源API,例如Apache PDFBox,可让您从PDF文档中提取文本数据。 在那种情况下,您还可以使用这些库在PI中创建自定义适配器模块,以提取感兴趣的内容(SSN)并生成适当的消息,以传递到您的后端系统以进行处理/链接,如您所述。 将文件的有效负载转换为XSTRING或base64格式并包括提取的内容,以便您可以与适当的SSN#链接-也许可以使用附件,但我从未尝试过这样做,所以我不能说。

< p>关于

Ryan Crosby

一周热门 更多>