- #只关心 Word 文档中的文本, 不关心样式信息, 就可以利用 getText() 函数
- import docx
- def getText(filename):
- doc=docx.Document(filename)
- fullText=[]
- for para in doc.paragraphs:
- fullText.append(para.text)
- return '\n'.join(fullText)
- print(getText('example.docx'))
- # 下面的代码可以实现同样的功能
- doc2=docx.Document('example.docx')
- #paragraphs 是 paragraph 对象的列表 所以下面这个会显示数字
- for i in range(0,len(doc2.paragraphs)):# 获取段落的数量
- print(doc2.paragraphs[i].text)#text 显示段落的文本
来源: http://www.bubuko.com/infodetail-3166818.html