改良后的代码可以对 python 和 C 系列的代码实行行数计算, 包括代码, 空行和注释行, 用 re 抓取注释, 传入一个目录自动对其下的文件进行读取计算
流程
首先判断传入参数是否为文件夹, 不是则打印出提示, 否则继续(无返回), 获得目录后, yongos.listdir 对路径下文件进行遍历, 其中也包含文件夹, 再次判断是否为文件夹, 是的话则递归调用此函数, 否则开始执行行数统计, 这里用 os.path.join 将路径与文件名进行拼接, 方便之后直接传给函数, 逻辑很简单, 无非是执行文件判断, 判断是哪类文件, 在调用对应的注释监测正则代码段进行抓取, 抓取到则行数 + 1, 空白行也是一样的原理, 用 strip(去除前后空格), 然后行内内容为空则为空行, 代码段即为总行数减去其他两类行数, 最后在外层将所有文件对应的代码段累加即为 total
关键
函数内部是可以访问全局变量的, 问题在于函数内部修改了变量, 导致 python 认为它是一个局部变量.
所以, 如果在函数内部访问并修改全局变量, 应该使用关键字 global 来修饰变量
- import os
- import re
- # 定义规则抓取文件中的 python 注释
- re_obj_py = re.compile('[(#)]')
- # 定义规则抓取文件中的 C 语言注释
- re_obj_c = re.compile('[(//)(/*)(*)(*/)]')
- # 判断是否为 python 文件
- def is_py_file(filename):
- if os.path.splitext(filename)[1] == '.py':
- return True
- else:
- return False
- # 判断是否为 c 文件
- def is_c_file(filename):
- if os.path.splitext(filename)[1] in ['.c', '.cc', '.h']:
- return True
- else:
- return False
- # 定义几个全局变量用于计算所有文件总和(全部行数, 代码行数, 空行数, 注释行数)
- all_lines, code_lines, space_lines, comments_lines = 0, 0, 0, 0
- # 判断是否为文件夹, 不是则输出提示
- def count_codelines(dirpath):
- if not os.path.isdir(dirpath):
- print('input dir: %s is not legal!' % dirpath)
- return
- # 定义几个全局变量用于计算每个文件行数(全部行数, 代码行数, 空行数, 注释行数)
- global all_lines, code_lines, space_lines, comments_lines
- #列出当前文件夹下的文件(包含目录)
- all_files = os.listdir(dirpath)
- for file in all_files:
- #将文件 (目录) 名与路径拼接
- file_name = os.path.join(dirpath, file)
- if os.path.isdir(file_name):
- count_codelines(file_name)
- else:
- temp_all_lines, temp_code_lines, temp_space_lines, temp_comments_lines = 0, 0, 0, 0
- f = open(file_name)
- for line in f:
- temp_all_lines += 1
- if line.strip() == '':
- temp_space_lines += 1
- continue
- if is_py_file(file_name) and re_obj_py.match(line.strip()):
- temp_comments_lines += 1
- if is_c_file(file_name) and re_obj_c.match(line.strip()):
- temp_comments_lines += 1
- temp_code_lines = temp_all_lines - temp_space_lines - temp_comments_lines
- print('%-15s : all_lines(%s)\t code_lines(%s)\t space_lines(%s)\t comments_lines(%s)'
- % (file, temp_all_lines, temp_code_lines, temp_space_lines, temp_comments_lines))
- all_lines += temp_all_lines
- code_lines += temp_code_lines
- space_lines += temp_space_lines
- comments_lines += temp_comments_lines
- if __name__ == '__main__':
- count_codelines('test')
- print('\n**** TOTAL COUNT ****\nall_lines = %s\ncode_lines = %s\nspace_lines = %s\ncomments_lines = %s' % (all_lines, code_lines, space_lines, comments_lines))
更多代码详情参考我的 GitHub https://github.com/MAYA-MUYI/Python
来源: http://www.jianshu.com/p/0c7180c69b69