当前位置：

首页
/
IT
/
程序
/
Python
/
04-Python 之文件, 异常和模块

04-Python 之文件, 异常和模块

1, 掌握外部文件读取和存储各类方法.

2, 掌握异常的处理办法.

3, 掌握外部模块导入和调用的方法.

实际应用中, 我们绝大数的数据都是通过文件的交互完成的.

1. 文件的读写

1.1 文件的打开

文件的打开通用格式

with open("文件路径","打开模式",encoding = "操作文件的字符编码") as f: # 对文件进行相应的读写操作

1文件路径: 程序与文件在同一文件夹, 可简化成文件名

2打开模式:

- "r" 只读模式, 如文件不存在, 报错

- "w" 覆盖写模式, 若文件不存在, 则创建; 若文件存在, 则完全覆盖原文件

- "x" 创建写模式, 若文件存在, 则报错, 若不存在则创建

- "a" 追加写模式, 若文件不存在, 则创建, 若存在则在原文件后追加内容

- "b" 二进制文件模式, 不能淡入使用, 需要配合使用如 "rb" "wb" "ab", 该模式不需指定 encoding

- "t" 文本文件模式, 默认值, 需配合使用如 "rt" "wt" "at"

- "+" 与 "r" "w" "x" "a" 配合使用, 在原功能基础上, 增加读写功能

- 打开模式缺省, 默认为只读模式

3字符编码:

- utf-8: 万国码, 包含全世界所有国家需要用到的字符

- gbk: 中文编码, 专门解决中文编码问题, Windows 系统, 如果缺省, 则默认 gbk(所在区域的编码), 建议除处理二进制文件, 建议不要缺省 encoding

使用 with 块的好处: 执行完毕后, 自动对文件进行 close 操作

with open("E:\ipthon \ 测试文件. txt","r",encoding="gbk") as f:  # 打开文件
    text = f. read()    # 读取文件
    print(text)

1.2 文件的读取

读取整个内容 --f.read()

解码模式不匹配, 报错

逐行进行读取 --f.readline()

读入所有行, 以每行为元素形成一个列表 --f.readlines()

图片是二进制文件

注意: 当文件比较大时, read()和 readlines()占用内存过大, 不建议使用, 推荐使用如下方式

with open("三国演义片头曲_gbk.txt","r",enconding="gbk") as f:
        for text in f:                # f 本身就是一个可迭代对象, 每次迭代读取一行内容
            print(text)

1.3 文件的写入

向文件写入一个字符串或字符流(二进制)--f.write()

追加模式 --"a"

将一个元素为字符串的列表整体写入文件 --f.writelines()

ls = ["春天刮着风", "秋天下着雨", "春风秋雨多少海誓山盟随风远去"]
with open("恋雨 1980.txt", "w", encoding="utf-8") as f:
    f.writelines(ls)

1.4 既读又写

"r+": 如果文件名不存在, 则报错; 文件指针在文件最开始, 需要把指针移动到末尾才能开始写, 否则会覆盖前面内容

with open("浪淘沙_北戴河. txt", "r+", encoding="utf-8") as f:
#    for line in f:
#        print(line)  #遍历文件 f, 指针达到结尾
    f.seek(0, 2) # 或者可以将指针移到末尾 f.seek(偏移字节数, 位置(0: 开始; 1: 当前位置; 2: 结尾))
    text = ["萧瑟秋风今又是,\n", "换了人间,\n"]
    f.writelines(text)

"w+": 若文件不存在, 则创建; 若文件存在, 会立刻清空原内容

with open("浪淘沙_北戴河. txt", "w+", encoding="utf-8") as f:
    text = ["萧瑟秋风今又是,\n", "换了人间,\n"] # 清空原内容
    f.writelines(text)
    f.seek(0, 0)  # 指针移到开始
    print(f.read())

"a+": 若文件不存在, 则创建; 指针在末尾, 添加新内容, 不会清空原内容

2 数据的存储与读取

通用的数据格式, 可以在不同语言中加载和存储, 主要了解数据存储结构 CSV 和 JSON

2.1 CSV 格式

CSV 格式由逗号将数据分开的字符序列, 可以由 Excel 打开

读取

with open("成绩. csv","r",encoding="gbk") as f:
    ls = []
    for line in f:
        ls.append(line.strip("\n").split(",")) #去掉每行的换行符, 并用 "," 进行分割返回列表
for res in ls:
    print(res)

写入

ls = [["编号", "数学成绩", "语文成绩"], ['1', '100', '98'], ['3', '97', '95']]
with open("score.csv","w",encoding="gbk") as f:            # encoding="utf-8" 中文出现乱码
    for row in ls:
        f.write(",".join(row)+"\n")      # 逐行写入. 用逗号组合成字符串形式

也可借助 CSV 模块完成上述操作

2.2 JSON 格式

常用来存储字典格式

写入 --dump()

scores = {"Petter": {"math": 96, "pysics": 98},
          "Paul": {"math": 92, "pysics": 99},
          "Mary": {"math": 98, "pysics": 97}}
with open("score.json", "w", encoding="utf-8") as f:
    # indent: 表示字符串换行 + 缩进 ensure_ascii=False 显示中文
    JSON.dump(scores, f, indent=4, ensure_ascii=False)

读取 --load()

with open("score.json", "r", encoding="utf-8") as f:
    scores = JSON.load(f)   # 加载整个对象
    for k, v in scores.item():
        print(k, v)

3 异常处理

3.1 常见异常的产生

除 0 异常 --ZeroDivisionError

找不到可读文件 --FileNotFoundError

值错误 --ValueError: 传入一个调用者不期望的值, 即使这个值的类型是正确的

类型错误 --TypeError: 传入对象类型与要求不符

索引错误 --IndexError: 下标超出序列边界

其他常见的异常类型: NameError 使用一个还未被赋予对象的变量 KeyError 试图访问字典里不存在的键

当异常发生的时候, 如果不预先设定处理方法, 程序就会中断

3.2 异常的处理

提高程序的稳定性和可靠行

try_except

如果 try 内代码块顺利执行, except 不被触发; 如果 try 内代码块发生错误, 触发 except 执行 except 内代码块

单分支

x = 10
y = 0
try:
    z = x/y
except ZeroDivisionError:
    print("0 不可以被除")

多分支

d = {"name": "大杰仔"}
try:
    d["age"]
except NameError:
    print("变量名不存在")
except IndexError:
    print("索引超出界限")
except KeyError:
    print("键不存在")

万能异常 Exception(所有错误的老祖宗)

捕获异常的值 as

ls = []
d = {"name": "大杰仔"}
try:
    y = x
    ls[3]
    d["age"]
except Exception as e:
    print(e)

try_except_else: 如果 try 模块执行, 则 else 模块也会执行, 也可将 else 看做 try 成功的额外奖赏

try_except_finally: 不论 try 模块是否执行, finally 都会被执行

4 模块

已经被封装好, 无需自己再 "造轮子", 声明导入后拿来即用

4.1 广义模块分类

1Python 内置: 时间库 time; 随机库 random; 容器数据类型 collection; 迭代器函数 itertools

2第三方库: 数据分析 numpy,pandas; 数据可视化 matplotlib; 机器学习 scikit-learn; 深度学习 Tensorflow

3自定义文件: 文件夹内有多个 py 文件, 再加一个__init__.py 文件(内容可为空)

4.2 模块的导入

导入整个模块 --import 模块名

- 调用方式: 模块名. 函数名或类名

从模块中导入类或函数 --from 模块 import 类名或函数名

- 调用方式: 函数名或类名

导入模块中所有的类和函数 -- from 模块 import *

4.3 模块的查找路径

模块搜索查找顺序:

1内存中已经加载的模块

2内置模块: Python 启动时, 解释器会默认加载一些 modules 存放在 sys.modules(包含一个由当前载入 (完整且成功导入) 到解释器的模块组成的字典, 模块名作为域, 他们的位置作为值)中

import sys
print(len(sys.modules))
print("math" in sys.modules)
print("numpy" in sys.modules)
for k,v in list(sys.modules.items())[:5]:
    print(k, ":", v)
"""
875
True
True
sys : <module 'sys' (built-in)>
builtins : <module 'builtins' (built-in)>
_frozen_importlib : <module 'importlib._bootstrap' (frozen)>
_imp : <module '_imp' (built-in)>
_thread : <module '_thread' (built-in)>
"""

3sys.path 路径中包含的模块: sys.path 的第一个路径是当前执行文件所在的文件夹; 若需将不在该文件夹内的模块导入, 需要将模块的路径添加到 sys.path

import sys
sys.path.append("C:\\User\\ibm\\Desktop")    #注意是双斜杠
import fun3
fun3.f3()

来源: http://www.bubuko.com/infodetail-3408702.html

与本文相关文章

暂无,快来抢沙发吧！