PDF Informatica中的数据源

Informatica如何处理像PDF这样的非结构化数据源?如果表格报告存储为PDF,我们可以将其作为表格数据(如.NET中的数据表)从PDF中读出吗?     
已邀请:
Informatica PowerCenter非结构化数据选项 PDF数据表 网站 有趣的是你提到它,我曾经为发明基础技术的初创公司工作,直到收购Informatica。     
PDF实际上是内部结构化的。最近对PDF规范的修订可能提供了一种方法来保存数据以备外部处理,但PDF文档的主要目标是描述用于打印的文档,因此各种环境和设备都可以打印文档,结果如下:尽可能相似。 它主要取决于PDF的创建者,如果提供了除打印文本和行以形成表格的位置之外的任何额外数据。     
您必须使用处理非结构化数据的Informatica B2B数据交换产品。该产品提供的功能可以处理各种非结构化数据,不仅包括PDF,还包括Word,Excel,Star Office,AFP,PostScript,PCL和HTML。您必须使用Informatica B2B数据转换。 这是快速链接供您参考。 http://www.informatica.com/us/products/b2b-data-exchange/b2b-data-transformation/     

要回复问题请先登录注册