从PDF获取数据

2020-08-24 13:34发布

         点击此处--->   EasySAP.com群内免费提供SAP练习系统(在群公告中)

加入QQ群:457200227(SAP S4 HANA技术交流) 群内免费提供SAP练习系统(在群公告中)


你好

由于宣布了社会保障,我们从联邦政府那里得到了一些PDF文件。

我们必须将这些文件连接到相应的人员编号。 可以在PDF文件中找到该编号。

有人可以告诉我们如何在PDF中自动检测该数字吗? 我们如何在ABAP程序中读取这些"非结构化"数据?

该文档不是SAP提供的交互式Adobe表单的结果。

感谢您的帮助。

克里斯

2016年8月1日15-37-44.jpg (71.8 kB)

         点击此处--->   EasySAP.com群内免费提供SAP练习系统(在群公告中)

加入QQ群:457200227(SAP S4 HANA技术交流) 群内免费提供SAP练习系统(在群公告中)


你好

由于宣布了社会保障,我们从联邦政府那里得到了一些PDF文件。

我们必须将这些文件连接到相应的人员编号。 可以在PDF文件中找到该编号。

有人可以告诉我们如何在PDF中自动检测该数字吗? 我们如何在ABAP程序中读取这些"非结构化"数据?

该文档不是SAP提供的交互式Adobe表单的结果。

感谢您的帮助。

克里斯

2016年8月1日15-37-44.jpg (71.8 kB)
付费偷看设置
发送
10条回答
clever101
1楼 · 2020-08-24 13:46.采纳回答

无论实际包含什么pdf(位图,压缩图像,文本块,标签,表格),都不要指望一个简单的单一的Abap解决方案(仅用于文本,具有pdf技术规范的丰富知识并链接到一些Adobe库)。 )-在Adobe论坛上搜索Google ...

更好地寻找附加组件/应用程序,是否已经有任何OCR/取消实现工具可用于扫描公司收到的发票或交货单,信件,传真,如SAP/Open Text,Readsoft以及您系统中的许多其他功能?

问候,

Raymond

暮风yp
2楼-- · 2020-08-24 13:50

Kris,

PDF的文件名是什么? 如果'personel-number'是文件名的一部分,则只需提取它即可。 如果没有,您可以请求将文件名中带有" personel-number"的文件发送给您。

我还没有使用任何OCR(或类似的)软件将数据读取到ABAP程序中,所以这可能是无关紧要的问题,但是如果将来收到的PDF格式发生变化怎么办? 那会带来问题吗?

-Amit。

CPLASF-自律
3楼-- · 2020-08-24 13:47

不确定,如果您来自比利时,是否在https://www.socialsecurity.be/site_fr/employer/infos/index.htm

此致

< p> Raymond

歪着头看世界
4楼-- · 2020-08-24 13:54

可以使用OCR技术和常规PDF数据读取技术在UIPath中提取PDF数据

一周热门 更多>