这里有新鲜出炉的 Python 入门,程序狗速度看过来!
Python 是一种面向对象、解释型计算机程序设计语言,由 Guido van Rossum 于 1989 年底发明,第一个公开发行版发行于 1991 年。Python 语法简洁而清晰,具有丰富和强大的类库。它常被昵称为胶水语言,它能够把用其他语言制作的各种模块(尤其是 C/C++)很轻松地联结在一起。
下面小编就为大家带来一篇对 Python 进行数据分析_关于 Package 的安装问题。小编觉得挺不错的,现在就分享给大家,也给大家做个参考。一起跟随小编过来看看吧
一、为什么要使用 Python 进行数据分析?
python 拥有一个巨大的活跃的科学计算社区,拥有不断改良的库,能够轻松的集成 C,C++,Fortran 代码(Cython 项目),可以同时用于研究和原型的构建以及生产系统的构建。
二、Python 的优势与劣势:
1.Python 是一种解释型语言,运行速度比编译型数据慢。
2. 由于 python 有一个全局解释器锁(GIL), 防止解释器同时执行多条 python 字节码,所以 python 不适用于高并发、多线程的应用程序。
三、使用 Python 进行数据分析常用的扩展包。
目前初始阶段的学习主要涉及 4 个包的安装:numpy、scipy、pandas、matplotlib
我笔记本里安装的是 Python2.7 版本,在安装了 pip 和 setuptools 工具,关于 pip 和 setuptools 工具的安装详见相关笔记。
最初使用的安装命令很简单:
- pip install pandas
- pip install numpy
- pip install scipy
- pip install matplotlib
但是只安装成功了 numpy 和 matplotlib 两个包,pandas 和 scipy 安装失败,查阅了相关资料发现可能是版本问题或者包的依赖相关。
最终在 stack overflow 发现了一个很棒的 Python 包提供网址:http://www.lfd.uci.edu/~gohlke/pythonlibs/#scipy
-- 这里要 Mark 一下,后边争取写一个爬虫,搞下来所有的包防止丢失。
以上网址是加州大学欧文分校提供的 Python 相关库的下载地址,修改 #后边的名字可以进去其他包的下载页面,此页面中提供了安装某个包需要依赖的前置包的说明,非常友好。
依赖包说明类似:
- Pandas,
- a cross - section and time series data analysis toolkit.Requires numpy,
- dateutil,
- pytz,
- setuptools,
- and optionally numexpr,
- bottleneck,
- scipy,
- matplotlib,
- pytables,
- lxml,
- xarray,
- blosc,
- backports.lzma,
- statsmodels,
- sqlalchemy and other dependencies.
然后就是一堆的 pandas 下载地址。
最终根据各个包的相关性先安装了 numpy+mkl 的 whl 文件,然后是安装 scipy 最后是 pandas。
安装的方法如下:
1. 下载对应的 4 个包放在 D:\ 目录下(很奇怪我笔记本是 AMD64 位的但是安装 amd64 版本的包报不支持的 platform 的错误,安装了 32 位的可以正常 import)
2.cmd 命令行进入 D:\ 目录执行:pip install <包的全名> 进行安装。(如果已安装了其他错误的版本,使用 pip uninstall 卸载)
最后使用如下类似命令查看包的安装位置:
以上这篇对 Python 进行数据分析_关于 Package 的安装问题就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持 PHPERZ。
来源: http://www.phperz.com/article/17/0602/335744.html