从使用itext创建的PDF中删除HTML和CSS样式
||
我们正在应用程序中使用itext动态创建PDF。用户使用具有RTF编辑器的屏幕将PDF的内容插入Web应用程序中。
以下是具体步骤。
用户转到添加PDF内容页面。
添加页面具有一个RTF编辑器,他可以在其中输入PDF内容。
有时,用户可以从现有Word文档中复制/粘贴内容,然后输入RTE。
一旦他提交了内容,便创建了PDF。
之所以使用RTE,是因为我们还有其他页面需要用粗体,斜体等显示内容。
但是,我们不希望生成PDF中的RTE内容。
在生成PDF之前,我们已经使用了一些Java实用程序从内容中删除了RTE内容。
这正常工作,但是当从word文档中复制内容时,我们使用的java实用工具不会删除该文档应用的html和css样式。
如何生成没有任何HTML或CSS的PDF?
这是代码
Paragraph paragraph = new Paragraph(Util.removeHTML(content), font);
并且removeHTML方法如下
public static String removeHTML(String htmlString) {
if (htmlString == null)
return \"\";
htmlString.replace(\"\\\"\", \"\'\");
htmlString = htmlString.replaceAll(\"\\\\<.*?>\", \"\");
htmlString = htmlString.replaceAll(\" \", \"\");
return htmlString;
}
下面是我从Word文档复制/粘贴时在PDF中显示的其他内容。
<w:LsdException Locked=\"false\" Priority=\"10\" SemiHidden=\"false
UnhideWhenUsed=\"false\" QFormat=\"true\" Name=\"Title\" />
<w:LsdException Locked=\"false\" Priority=\"11\" SemiHidden=\"false\"
UnhideWhenUsed=\"false\" QFormat=\"true\" Name=\"Subtitle\" />
<w:LsdException Locked=\"false\" Priority=\"22\" SemiHidden=\"false\"
请帮忙 !
谢谢。
没有找到相关结果
已邀请:
2 个回复
乏摩纶誊伟
以下是Groovy服务中的一些代码,我们通过构建这些代码来清理HTML,并且仅保留iText支持的标签和样式属性+解决了表格问题。在代码中做出了一些特定于我们应用程序的假设。目前,这对我们来说真的很好。
伐教爸