为什么要利用 python 进行数据分析?python 拥有一个巨大的活跃的科学计算社区,拥有不断改良的库, 能够轻松的集成 C,C++,Fortran 代码(Cython 项目),可以同时用于研究和原型的构建以及生产系统的构建。
Python 是一种面向对象、解释型计算机程序设计语言,由 Guido van Rossum 于 1989 年底发明,第一个公开发行版发行于 1991 年。Python 语法简洁而清晰,具有丰富和强大的类库。它常被昵称为胶水语言,它能够把用其他语言制作的各种模块(尤其是 C/C++)很轻松地联结在一起。
1: 文件内容格式为 json 的数据如何解析
- import json,os,sys
- current_dir=os.path.abspath(".")
- filename=[file for file in os.listdir(current_dir) if ".txt" in file]#得到当前目录中,后缀为.txt的数据文件
- fn=filename[0] if len(filename)==1 else "" #从list中取出第一个文件名
- if fn: # means we got a valid filename
- fd=open(fn)
- content=[json.loads(line) for line in fd]
- else:
- print("no txt file in current directory")
- sys.exit(1)
- for linedict in content:
- for key,value in linedict.items():
- print(key,value)
- print("\n")
2:出现频率统计
- import random
- from collections import Counter
- fruits=[random.choice(["apple","cherry","orange","pear","watermelon","banana"]) for i in range(20)]
- print(fruits) #查看所有水果出现的次数
- cover_fruits=Counter(fruits)
- for fruit,times in cover_fruits.most_common(3):
- print(fruit,times)
- ########运行结果如下:apple在fruits里出了5次
- apple 5
- banana 4
- pear 4
3: 重新加载 module 的方法 py3
- import importlib
- import.reload(modulename)
4:pylab 中包含了哪些 module
- from pylab import *
等效于下面的导入语句:
- from pylab import *
- from numpy import *
- from scipy import *
- import matplotlib
来源: