使用Python从Word文档中提取图像和文本

| 我想在充满Word文档的文件夹上运行一个脚本,该脚本可读取文档并提取图像及其标题(图像正下方的文本)。根据我所做的研究,我认为pywin32可能是一个可行的解决方案。我知道如何使用pywin32查找字符串并将其拉出,但是我需要图像部分的帮助。找到图像时,我该如何读取docx文件并发生事件?感谢您的任何帮助!我正在使用Python 2.7。     
已邀请:
        可以解压缩Docx文件以提取图像。     
        在这篇文章中找到一些启发。如何在Word 2007 .docx文件中搜索单词?     
        您可以使用python模块docx2txt从docx文件中提取文本和图像     
        
document =docx.Document(filepath)
for image in document.inline_shapes:
    print (image.width, image.height)
试试这个,它将起作用。     

要回复问题请先登录注册