这里有新鲜出炉的 Python 入门,程序狗速度看过来!
Python 是一种面向对象、解释型计算机程序设计语言,由 Guido van Rossum 于 1989 年底发明,第一个公开发行版发行于 1991 年。Python 语法简洁而清晰,具有丰富和强大的类库。它常被昵称为胶水语言,它能够把用其他语言制作的各种模块(尤其是 C/C++)很轻松地联结在一起。
这篇文章主要介绍了 Python 读取指定目录下指定后缀文件并保存为 docx, 需要的朋友可以参考下
最近有个奇葩要求 要项目中的 N 行代码 申请专利啥的
然后作为程序员当然不能复制粘贴 用代码解决。。
使用 python-docx 读写 docx 文件
环境使用 python3.6.0
首先 pip 安装 python-docx
pip install python-docx
然后下面是脚本 修改目录,这里默认取脚本运行目录下的 src 文件夹 取. cs 后缀的所有文件 读取并保存为 docx
有一点需要注意,如果文件中有中文,请用 vscode 或者其他编辑器使用 utf-8 格式打开,看看有没有乱码 其中每处理一个文件都会有 print 输出 当看到只有 ---start 没有 end 的时候就可以找到该文件查看是否有上面说的情况,修改后保存重新执行,一直到全部执行完毕,保存好 docx 文件
代码
- # -- coding: UTF-8 --
- # Created by luody on 2017/4/7.
- import os
- from docx import Document
- saveFile = os.getcwd() + "/code.docx"
- mypath = os.getcwd() + "/src"
- doc = Document()
- doc.add_heading("代码文档", 0)
- p = doc.add_paragraph('服务端代码,使用语言')
- p.add_run('C#,SQL').bold = True
- lineNum = 0
- for root, dirs, files in os.walk(mypath):
- for filespath in files:
- if (filespath.endswith('.cs')):
- doc.add_heading(filespath, level=1)
- codePage = ''
- print(filespath+' ---- start')
- for line in open(os.path.join(root, filespath), encoding="utf-8"):
- codePage += line
- lineNum += 1
- print(filespath+' ---- end')
- doc.add_paragraph(codePage, style='IntenseQuote')
- doc.add_page_break()
- p = doc.add_paragraph(u'总行数:')
- p.add_run(str(lineNum)).bold = True
- doc.save('code.docx')
- print(lineNum)
以上所述是小编给大家介绍的 Python 读取指定目录下指定后缀文件并保存为 docx,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对 PHPERZ 网站的支持!
来源: http://www.phperz.com/article/17/0514/334291.html