当前位置：

首页
/
IT
/
程序
/
Python
/
Python 基础学习 (第三周)

Python 基础学习 (第三周)

集合的操作

集合是一个无序的, 不重复的数据组合, 它的主要作用如下:

去重, 把一个列表变成集合, 就自动去重了

关系测试, 测试两组数据之间的交集, 差集, 并集等关系

集合的写法

list_1 = set([1, 3, 4, 6, 7, 12, 5])

集合的关系

list_1 = set([1, 3, 5, 7, 4, 9, 10])
list_2 = set([1, 8, 10, 15, 12])

集合的交集

print(list_1.intersection(list_2)) 等价于 print(list_1 & list_2)

--->{1, 10}

集合的并集

print(list_1.union(list_2)) 等价于 print(list_1 | list_2)

-->{1, 3, 5, 7, 8, 4, 9, 10, 15, 12}

集合的差集

print(list_1.difference(list_2)) 等价于 print(list_1 - list_2)

-->{3, 5, 7, 4, 9}

集合的子集

print(list_1.issubset(list_2))

list_1 是否是 list_2 的子集

集合的父集

print(list_1.issuprset(list_2))

list_1 是否是 list_2 的父集

集合的对称差集

print(list_1.symmetric_difference(list_2)) 等价于 list_1 ^ list_2

-->{3, 5, 7, 4, 9, 8, 15, 12}

集合的其他函数用法

list_2.isdisjoint(list_3) #两个无交集返回 true
list_1.add(4) #集合的添加
list_1.remove(4) #集合的删除, 注意当集合中没有该元素会报错所以我们更多用下这个删除
list_1,discard(4) #删除, 没有该元素则什么都不操作

文件的操作

文件的操作流程

1. 打开文件, 得到文件句柄并赋给变量一个值

2. 通过句柄对文件进行操作

3. 关闭文件

f = open("guangzhou", "r", encoding = "utf-8") #文件句柄
data = f.read() #f.readline() 读取一行
f.close()

这样就把整个文件给读出来了, 假如 read() 两遍, 那么第二个 read() 会读出空的内容, 因为当第一个 read() 执行完成后, 这个时候光标位置就处在文件的结束位置, 再进行读取的时候也就读不到内容了.

文件的操作模式

r: 读模式, 默认是读模式

open("guangzhou", "r", encoding = "utf-8")

w: 写模式, 打开文件时时创建一个文件, 也就是原来的文件没有了

open("guangzhou", "w", encoding = "utf-8")

a: 追加模式

open("guangzhou", "a", encoding = "utf-8") 只是不覆盖文件, 在文件的后面追加内容, 这个模式还不支持读 read

r+: 读写模式, 以读和追加的方式来读写, 不管光标位置在哪, 都在最后面写

w+: 写读模式, 只能在最后面写, 不能写到中间, 这是硬盘机制

a+: 追加读

rb: 二进制读, 用途网路传输, 读取音频视频文件

wb: 二进制写

文件从一个文件读取并改变内容保存到另外一个文件

f = open("guangzhou", "r", encoding = "utf-8")
f_new = open("guanghzou3", "w", encoding = "utf-8")
# 循环读取文件, 且这种效率最高, 比 readlines() 高好多
for line in f:
  if "人在广东已经漂泊十年" in line:
  line = line.replace("人在广东已经漂泊十年", "Jason 在广东已经漂泊两年")
  f_new.write(line)
f.close()
f_new.close()

文件的其他方法

f = open("guangzhou", "r", encoding = "utf-8")
f.tell() #返回光标的位置, 该返回的位置是字符的位置
f.seek(0) #回到某个光标位置

flush 方法

当我们在以写文件的方式打开一个文件的时候, 我们执行完一条语句 write 并不一定写到了硬盘上, 它是先存到了内存中, 当内存达到一定大小的时候才开始往硬盘上面写, 这是因为内存的写速度要比硬盘快的多, 但是当某些特定条件下需要实时刷新的话, 我们就要用 flush 进行强制刷新, 比如进度条, 下面的例子:

import sys, time
for i in range(20):
  sys.stdout.write("*")
  sys.stdout.flush()
  time.sleep(0.1)

自己可以执行下看一下

with 语句

为了避免文件打开后忘记关闭, 可以通过管理上下文, 即:

with open("guangzhou", "r") as f:

2.7 版本之后也支持同时对多个文件管理, 即:

with open("guangzhou", "r") as f, open("guangzhou2", "r") as f2:

字符编码与转码

字符集发展史

中国字符集发展: gb2312--->gb18030-->gbk

国际字符集发展: ascii(英文占用一个字节, 不能存中文)-->unicode(英中占用两个字节)-->utf-8(中文占用 3 个字节, 英文一个字节)

函数与函数式编程

函数的定义方法

def text(x):
  "The function definitions"
  x += 1
  return x

函数可以返回多个值, 用元组来返回, 比如 return 1, 3, "hello", ["a", "b", "c"], {"name":"Jason"} 返回其实是 (1, 3, "hello", ["a", "b", "c"], {"name":"Jason"})

函数增加参数

def text(x,y):
  print(x,y)

调用方式:

1.text(1, 2) -->1,2 位置参数调用

2.text(x = 2,y = 1) -->2,1 关键字参数调用

3.text(2, y = 1)      -->2 , 1
4. x = 1,
y = 2
text(x, y)        -->1, 2

5.text(1, x = 2) 报错, x 得到了多个值

6.text(x = 2, 1) 报错

综上所述, 当既有位置参数又有关键字参数的时候, 关键参数的后面不能有位置参数, 且不能给多个参数赋值

函数的默认参数

1. 参数固定

def text(x, y = 2):
  print(x,y)

2. 参数不固定, 接受 N 个位置参数输出用元组

def text(*args):
  print(args)

text(1, 2, 3, 4, 6) 或者 text(*[1, 2, 3, 4, 6])

-->(1, 2, 3, 4, 6) 元组

3. 接受 N 个关键字参数输出字典方式

def text(**kwargs):
  print(kwargs)
text(name = "Jason", age = 24)  -->{'name':'Jason', 'age':24}

这些参数可以混合使用, 比如:

def text(name, *args, **kwargs):
  print(name)
  print(args)
  print(kwargs)

text("Jason", 1, 2, 5, name = "Jason", age = 24)

-->Jason
(1, 2, 5)
{'name':"Jason", 'age':24}

函数局部变量与全局变量

在子程序中定义的变量为局部变量, 在程序的一开始定的变量为全局变量, 全局变量作用域整个程序, 局部变量作用域定义该变量的子程序, 当全局变量与局部变量同名时, 在定义局部变量的子程序中, 局部变量起作用, 在其他地方全局变量起作用.

在子程序中, 变量字符串对全局变量的改变对外面没影响, 但是, 当全局变量为列表字典集合的时候, 这个时候改变会影响整个程序的

高阶函数

变量可以指向函数, 函数的参数能接受变量, 那么一个函数就可以就收另一个函数作为参数, 这种函数称之为高阶函数.

来源: https://www.cnblogs.com/jsaon-li/p/8912623.html

与本文相关文章

暂无,快来抢沙发吧！