最近感觉自己懈怠了很多, 同时身边总有杂事缠身, 一直停滞不前. 所以想来想去, 还是用老办法, 写写文章, 沉淀一下. 最近 Python 大火, 很多学校和机构也已经开设了 Python 的课程, 甚至国家在小学的课本里, 高考的考试里也加入了 Python 的内容. 正好最近自己也在学习 Python , 那就尝试将整个内容都整理出来, 给后来的人一些学习经验吧.
全文共 5500 字, 阅读要约 10 分钟.
1.1 关于 Python 你需要知道
Python 的作者, Guido von Rossum, 荷兰人.
Python 的发音与拼写
Python 的意思是蟒蛇, 源于作者喜欢的一部电视剧 (C 呢?)
Python 的作者是 Guido van Rossum(龟叔)
Python 是龟叔在 1989 年圣诞节期间, 为了打发无聊的圣诞节而用 C 编写的一个编程语言
Python 正式诞生于 1991 年
Python 的解释器如今有多个语言实现, 我们常用的是 CPython(官方版本的 C 语言实现), 其他还有 Jython(可以运行在 Java 平台),IronPython(可以运行在. NET 和 Mono 平台),PyPy(Python 实现的, 支持 JIT 即时编译)
Python 目前有两个版本, Python2 和 Python3, 最新版分别为 2.7.12 和 3.5.2, 现阶段大部分公司用的是 Python2
Life is shot, you need Python. 人生苦短, 我用 Python.
1.2 为什么要开发 Python
1.2.1 历史的发展
1982 年, Guido 从阿姆斯特丹大学获得了数学和计算机硕士学位. 然而, 尽管他算得上是一位数学家, 但他更加享受计算机带来的乐趣. 用他的话说, 尽管拥有数学和计算机双料资质, 他总趋向于做计算机相关的工作, 并热衷于做任何和编程相关的活儿.
在那个时候, Guido 接触并使用过诸如 Pascal,C,Fortran 等语言. 这些语言的基本设计原则是让机器能更快运行. 在 80 年代, 虽然 IBM 和苹果已经掀起了个人电脑浪潮, 但这些个人电脑的配置很低.
比如早期的 Macintosh, 只有 8MHz 的 CPU 主频和 128KB 的 RAM(随机存取存储器, 是与 CPU 直接交换数据的内部存储器), 一个大的数组就能占满内存. 所有的编译器的核心是做优化, 以便让程序能够运行.
为了增进效率, 语言也迫使程序员像计算机一样思考, 以便能写出更符合机器口味的程序. 在那个时代, 程序员恨不得用手榨取计算机每一寸的能力. 有人甚至认为 C 语言的指针是在浪费内存. 至于动态类型, 内存自动管理, 面向对象...... 别想了, 那会让你的电脑陷入瘫痪.
这种编程方式让 Guido 感到苦恼. Guido 知道如何用 C 语言写出一个功能, 但整个编写过程需要耗费大量的时间, 即使他已经准确的知道了如何实现. 他的另一个选择是 shell.
Bourne Shell 作为 UNIX 系统的解释器已经长期存在. UNIX 的管理员们常常用 shell 去写一些简单的脚本, 以进行一些系统维护的工作, 比如定期备份, 文件系统管理等等. shell 可以像胶水一样, 将 UNIX 下的许多功能连接在一起.
许多 C 语言下上百行的程序, 在 shell 下只用几行就可以完成. 然而, shell 的本质是调用命令. 它并不是一个真正的语言. 比如说, shell 没有数值型的数据类型, 加法运算都很复杂. 总之, shell 不能全面的调动计算机的功能.
Guido 希望有一种语言, 这种语言能够像 C 语言那样, 能够全面调用计算机的功能接口, 又可以像 shell 那样, 可以轻松的编程. ABC 语言让 Guido 看到希望. ABC 是由荷兰的数学和计算机研究所开发的. Guido 在该研究所工作, 并参与到 ABC 语言的开发. ABC 语言以教学为目的. 与当时的大部分语言不同, ABC 语言的目标是 "让用户感觉更好".ABC 语言希望让语言变得容易阅读, 容易使用, 容易记忆, 容易学习, 并以此来激发人们学习编程的兴趣.
1.2.2 希望的诞生
比如下面是一段来自 Wikipedia 的 ABC 程序, 这个程序用于统计文本中出现的词的总数:
- HOW TO RETURN words document:
- PUT {} IN collection
- FOR line IN document:
- FOR word IN split line:
- IF word not.in collection:
- INSERT word IN collection
- RETURN collection
复制代码
HOW TO 用于定义一个函数.
一个 Python 程序员应该很容易理解这段程序.
ABC 语言使用冒号和缩进来表示程序块.
行尾没有分号.
for 和 if 结构中也没有括号() .
赋值采用的是 PUT, 而不是更常见的等号.
这些改动让 ABC 程序读起来像一段文字.
尽管已经具备了良好的可读性和易用性, ABC 语言最终没有流行起来. 在当时, ABC 语言编译器需要比较高配置的电脑才能运行. 而这些电脑的使用者通常精通计算机, 他们更多考虑程序的效率, 而非它的学习难度. 除了硬件上的困难外, ABC 语言的设计也存在一些致命的问题: 可拓展性差. ABC 语言不是模块化语言. 如果想在 ABC 语言中增加功能, 比如对图形化的支持, 就必须改动很多地方. 不能直接进行 IO.ABC 语言不能直接操作文件系统. 尽管你可以通过诸如文本流的方式导入数据, 但 ABC 无法直接读写文 件. 输入输出的困难对于计算机语言来说是致命的. 你能想像一个打不开车门的跑车么? 过度革新. ABC 用自然语言的方式来表达程序的意义, 比如上面程序中的 HOW TO . 然而对于程序员来说, 他们更习惯 用 function 或者 define 来定义一个函数. 同样, 程序员更习惯用等号来分配变量. 尽管 ABC 语言很特别, 但学习难度 也很大. 传播困难. ABC 编译器很大, 必须被保存在磁带上. 当时 Guido 在访问的时候, 就必须有一个大磁带来给别人安装 ABC 编 译器. 这样, ABC 语言就很难快速传播.
1989 年, 为了打发圣诞节假期, Guido 开始写 Python 语言的编译器. Python 这个名字, 来自 Guido 所挚爱的电视剧 Monty Python's Flying Circus. 他希望这个新的叫做 Python 的语言, 能符合他的理想: 创造一种 C 和 shell 之间, 功能全面, 易学易用, 可拓展的语言. Guido 作为一个语言设计爱好者, 已经有过设计语言的尝试. 这一次, 也不过是一次纯粹的 hacking 行为.
1.2.3 Python 的诞生
1991 年, 第一个 Python 编译器诞生. 它是用 C 语言实现的, 并能够调用 C 语言的库文件.
从一出生, Python 已经具有了 : 类, 函数, 异常处理, 包含表和词典在内的核心数据类型, 以及模块为基础的拓展系统.
Python 语法很多来自 C, 但又受到 ABC 语言的强烈影响. 来自 ABC 语言的一些规定直到今天还富有争议, 比如强制缩进. 但这些语法规定让 Python 容易读.
另一方面, Python 聪明的选择服从一些惯例, 特别是 C 语言的惯例, 比如回归等号赋值. Guido 认为, 如果 "常识" 上确立的东西, 没有必要过度纠结. Python 从一开始就特别在意可拓展性. Python 可以在多个层次上拓展. 从高层上, 你可以直接引入. py 文件. 在底层, 你可以引用 C 语言的库. Python 程序员可以快速的使用 Python 写. py 文件作为拓展模块. 但当性能是考虑的重要因素时, Python 程序员可以深入底层, 写 C 程序, 编译为. so 文件引入到 Python 中使用. Python 就好像是使用钢构建房一样, 先规定好大的框架. 而程序员可以在此框架下相当自由的拓展或更改.
最初的 Python 完全由 Guido 本人开发. Python 得到 Guido 同事的欢迎. 他们迅速的反馈使用意见, 并参与到 Python 的改进. Guido 和一些同事构成 Python 的核心团队. 他们将自己大部分的业余时间用于 hack Python. 随后, Python 拓展到研究所之外.
Python 将许多机器层面上的细节隐藏, 交给编译器处理, 并凸显出逻辑层面的编程思考. Python 程序员可以花更多的时间用于思考程序的逻辑, 而不是具体的实现细节. 这一特征吸引了广大的程序员, Python 开始流行.
1.2.4 时势造英雄
我们不得不暂停我们的 Python 时间, 转而看一看瞬息万变的计算机行业.
1990 年代初, 个人计算机开始进入普通家庭.
Intel 发布了 486 处理器, windows 发布 window 3.0 开始的一系列视窗系统.
计算机的性能大大提高. 程序员开始关注计算机的易用性, 比如图形化界面.
由于计算机性能的提高, 软件的世界也开始随之改变.
硬件足以满足许多个人电脑的需要. 硬件厂商甚至渴望高需求软件的出现, 以带动硬件的更新换代.
C++ 和 Java 相继流行.
C++ 和 Java 提供了面向对象的编程范式, 以及丰富的对象库. 在牺牲了一定的性能的代价下, C++ 和 Java 大大提高了程序的产量. 语言的易用性被提到一个新的高度. 我们还记得 ,ABC 失败的一个重要原因是硬件的性能限制. 从这方面说, Python 要比 ABC 幸运许多.
另一个悄然发生的改变是 Internet.1990 年代还是个人电脑的时代, windows 和 Intel 挟 PC 以令天下, 盛极一时. 尽管 Internet 为主体的信息革命尚未到来, 但许多程序员以及资深计算机用户已经在频繁使用 Internet 进行交流, 比如使用 email 和 newsgroup.Internet 让信息交流成本大大下降.
一种新的软件开发模式开始流行: 开源. 程序员利用 业余时间进行软件开发, 并开放源代码.
1991 年, Linus 在 comp.os.minix 新闻组上发布了 Linux 内核源代码, 吸引大批 hacker 的加入. Linux 和 GNU 相互合作, 最终构成了一个充满活力的开源平台.
硬件性能不是瓶颈, Python 又容易使用, 所以许多人开始转向 Python.Guido 维护了一个 maillist,Python 用户就通过邮件进行交流. Python 用户来自许多领域, 有不同的背景, 对 Python 也有不同的需求. Python 相当的开放, 又容易拓展, 所以当用户不满足于现有功能, 很容易对 Python 进行拓展或改造.
随后, 这些用户将改动发给 Guido, 并由 Guido 决定是否将新的特征加入到 Python 或者标准库中. 如果代码能被纳入 Python 自身或者标准库, 这将极大的荣誉. 由于 Guido 至高无上的决定权, 他因此被称为 "终身的仁慈独裁者". Python 被称为 "Battery Included", 是说它以及其标准库的功能强大.
并且因为这些是整个社区贡献, 同时 Python 的开发者又来自不同领域, 他们将不同领域的优点带给 Python. 比如 Python 标准库中的正则表达是参考 Perl, 而 lambda, map, filter, reduce 等函数参考了 Lisp.Python 本身的一些功能以及大部分的标准库来自于社区. Python 的社 区不断扩大, 进而拥有了自己的 newsgroup, 网站, 以及基金.
从 Python 2.0 开始, Python 也从 maillist 的开发方式, 转为完全开源的开发方式. 社区气氛已经形成, 工作被整个社区分担, Python 也获得了更加高速的发展. 到今天, Python 的框架已经确立. Python 语言以对象为核心组织代码, 支持多种编程范式, 采用动态类型, 自动进行内存回收. Python 支持解释运行, 并能调用 C 库进行拓展. Python 有强大的标准库. 由于标准库的体系已经稳定, 所以 Python 的生态系统开始拓展到第三方包. 这些包, 如 Django,web.py,wxpython,numpy,matplotlib,PIL, 将 Python 升级成了物种丰富的热带雨林.
1.2.5 Python 的优点
简单
Python 是一种代表简单主义思想的语言. 阅读一个良好的 Python 程序就感觉像是在读英语一样, 尽管这个英语的要求非常严格! Python 的这种伪代码本质是它最大的优点之一. 它使你能够专注于解决问题而不是去搞明白语言本身.
易学
就如同你即将看到的一样, Python 极其容易上手. 前面已经提到了, Python 有极其简单的语法.
免费, 开源
Python 是 FLOSS(自由 / 开放源码软件)之一. 简单地说, 你可以自由地发布这个软件的拷贝, 阅读它的源代码, 对它做改动, 把它的一部分用于新的自由软件中. FLOSS 是基于一个团体分享知识的概念. 这是为什么 Python 如此优秀的原因之一 -- 它是由一群希望看到一个更加优秀的 Python 的人创造并经常改进着的.
高层语言
当你用 Python 语言编写程序的时候, 你无需考虑诸如如何管理你的程序使用的内存一类的底层细节.
可移植性
由于它的开源本质, Python 已经被移植在许多平台上(经过改动使它能够工作在不同平台上). 如果你小心地避免使用依赖于系统的特性, 那么你的所有 Python 程序无需修改就可以在下述任何平台上面运行.
这些平台包括 Linux,Windows,FreeBSD,Macintosh,Solaris,OS/2,Amiga,AROS,AS/400,BeOS,OS/390,z/OS,Palm OS,QNX,VMS,Psion,Acom RISC OS,VxWorks,PlayStation,Sharp Zaurus,Windows CE 甚至还有 PocketPC,Symbian 以及 Google 基于 linux 开发的 Android 平台!
解释性
这一点需要一些解释. 一个用编译性语言比如 C 或 C++ 写的程序可以从源文件 (即 C 或 C++ 语言) 转换到一个你的计算机使用的语言(二进制代码, 即 0 和 1). 这个过程通过编译器和不同的标记, 选项完成. 当你运行你的程序的时候, 连接 / 转载器软件把你的程序从硬盘复制到内存中并且运行. 而 Python 语言写的程序不需要编译成二进制代码. 你可以直接从源代码运行程序.
在计算机内部, Python 解释器把源代码转换成称为字节码的中间形式, 然后再把它翻译成计算机使用的机器语言并运行. 事实上, 由于你不再需要担心如何编译程序, 如何确保连接转载正确的库等等, 所有这一切使得使用 Python 更加简单. 由于你只需要把你的 Python 程序拷贝到另外一台计算机上, 它就可以工作了, 这也使得你的 Python 程序更加易于移植.
面向对象
Python 既支持面向过程的编程也支持面向对象的编程. 在 "面向过程" 的语言中, 程序是由过程或仅仅是可重用代码的函数构建起来的. 在 "面向对象" 的语言中, 程序是由数据和功能组合而成的对象构建起来的. 与其他主要的语言如 C++ 和 Java 相比, Python 以一种非常强大又简单的方式实现面向对象编程.
可扩展性
如果你需要你的一段关键代码运行得更快或者希望某些算法不公开, 你可以把你的部分程序用 C 或 C++ 编写, 然后在你的 Python 程序中使用它们.
丰富的库
Python 标准库确实很庞大. 它可以帮助你处理各种工作, 包括正则表达式, 文档生成, 单元测试, 线程, 数据库, 网页浏览器, CGI,FTP, 电子邮件, XML,XML-RPC,html,WAV 文件, 密码系统, GUI(图形用户界面),Tk 和其他与系统有关的操作.
记住, 只要安装了 Python, 所有这些功能都是可用的. 这被称作 Python 的 "功能齐全" 理念. 除了标准库以外, 还有许多其他高质量的库, 如 wxPython,Twisted 和 Python 图像库等等.
规范的代码
Python 采用强制缩进的方式使得代码具有极佳的可读性.
1.2.6 Python 的缺点
运行速度, 有速度要求的话, 用 C++ 改写关键部分吧.
Python 是解释型语言, 你的代码在执行时会一行一行地翻译成 CPU 能理解的机器码, 这个翻译过程非常耗时, 所以很慢. 而 C 程序是运行前直接编译成 CPU 能执行的机器码, 所以非常快.
但是大量的应用程序不需要这么快的运行速度, 因为用户根本感觉不出来. 例如开发一个下载 MP3 的网络应用程序, C 程序的运行时间需要 0.001 秒, 而 Python 程序的运行时间需要 0.1 秒, 慢了 100 倍, 但由于网络更慢, 需要等待 1 秒, 你想, 用户能感觉到 1.001 秒和 1.1 秒的区别吗? 这就好比 F1 赛车和普通的出租车在北京三环路上行驶的道理一样, 虽然 F1 赛车理论时速高达 400 公里, 但由于三环路堵车的时速只有 20 公里, 因此, 作为乘客, 你感觉的时速永远是 20 公里.
国内市场较小(国内以 python 来做主要开发的, 目前只有一些 web2.0 公司). 但时间推移, 目前很多国内软件公司, 尤其是游戏公司, 也开始规模使用他.
中文资料匮乏(好的 python 中文资料屈指可数). 托社区的福, 有几本优秀的教材已经被翻译了, 但入门级教材多, 高级内容还是只能看英语版.
构架选择太多(没有像 C# 这样的官方. net 构架, 也没有像 ruby 由于历史较短, 构架开发的相对集中. Ruby on Rails 构架开发中小型 web 程序天下无敌). 不过这也从另一个侧面说明, python 比较优秀, 吸引的人才多, 项目也多.
代码不能加密.
如果要发布你的 Python 程序, 实际上就是发布源代码, 这一点跟 C 语言不同, C 语言不用发布源代码, 只需要把编译后的机器码 (也就是你在 Windows 上常见的 xxx.exe 文件) 发布出去. 要从机器码反推出 C 代码是不可能的, 所以, 凡是编译型的语言, 都没有这个问题, 而解释型的语言, 则必须把源码发布出去.
这个缺点仅限于你要编写的软件需要卖给别人挣钱的时候. 好消息是目前的互联网时代, 靠卖软件授权的商业模式越来越少了, 靠网站和移动应用卖服务的模式越来越多了, 后一种模式不需要把源码给别人.
再说了, 现在如火如荼的开源运动和互联网自由开放的精神是一致的, 互联网上有无数非常优秀的像 Linux 一样的开源代码, 我们千万不要高估自己写的代码真的有非常大的 "商业价值". 那些大公司的代码不愿意开放的更重要的原因是代码写得太烂了, 一旦开源, 就没人敢用他们的产品了.
1.2.7 Python 的应用场景
Web 应用开发
Python 经常被用于 Web 开发. 比如, 通过 mod_wsgi 模块, Apache 可以运行用 Python 编写的 Web 程序.
Python 定义了 WSGI 标准应用接口来协调 Http 服务器与基于 Python 的 Web 程序之间的通信.
一些 Web 框架, 如 Django,TurboGears,web2py,Zope 等, 可以让程序员轻松地开发和管理复杂的 Web 程序.
操作系统管理, 服务器运维的自动化脚本
在很多操作系统里, Python 是标准的系统组件. 大多数 Linux 发行版以及 NetBSD,OpenBSD 和 Mac OS X 都集成了 Python, 可以在终端下直接运行 Python.
有一些 Linux 发行版的安装器使用 Python 语言编写, 比如 Ubuntu 的 Ubiquity 安装器, Red Hat Linux 和 Fedora 的 Anaconda 安装器. Gentoo Linux 使用 Python 来编写它的 Portage 包管理系统.
Python 标准库包含了多个调用操作系统功能的库. 通过 pywin32 这个第三方软件 包, Python 能够访问 Windows 的 COM 服务及其它 Windows API. 使用 IronPython,Python 程序能够直接调用. Net Framework.
一般说来, Python 编写的系统管理脚本在可读性, 性能, 代码重用度, 扩展性几方面都优于普通的 shell 脚本.
科学计算
NumPy,SciPy,Matplotlib 可以让 Python 程序员编写科学计算程序.
桌面软件
PyQt,PySide,wxPython,PyGTK 是 Python 快速开发桌面应用程序的利器.
服务器软件(网络软件)
Python 对于各种网络协议的支持很完善, 因此经常被用于编写服务器软件, 网络爬虫.
第三方库 Twisted 支持异步网络编程和多数标准的网络协议(包含客户端和服务器), 并且提供了多种工具, 被广泛用于编写高性能的服务器软件.
游戏
很多游戏使用 C++ 编写图形显示等高性能模块, 而使用 Python 或者 Lua 编写游戏的逻辑, 服务器.
相较于 Python,Lua 的功能更简单, 体积更小; 而 Python 则支持更多的特性和数据类型.
构思实现, 产品早期原型和迭代
YouTube,Google,Yahoo!,NASA 都在内部大量地使用 Python.
来源: https://juejin.im/post/5b52f9e66fb9a04fca3c7861