Excel 里面的透视表 (Pivot Table) 确实是做数据分析的必备技能. 透视表可以帮你迅速汇总数据, 看到各类型数据的直观特征就像是让你站在了一个更高的视角上去看你的数据. 作为进阶, Excel 自带的函数, 各种插件, 以及 VBA 也是很好的工具.
但当数据量大到用 Excel 打开都要好久, 电脑打开文件都会死机的时候, 这种也就不适合用 Office 工具了, 也或者我们想进一步提升能力的时候, 需要学习一些 hardcore 技能, 即用编程语言做数据分析.
这里主要有 R 和 Python 两大流派. 我个人推荐 Python, 一方面 Python 代码简单易懂, 容易上手; 另一方面学习资料超级多. 关于 Python 的学习资料, 这里我推荐《利用 Python 进行数据分析》, 这本书涵盖了利用 Python 做数据清洗, 数据可视化及分析的技能点, 可以作一本参考书, 工具书, 也可以对着书里面的案例进行实操.
- importxlrd
- workbook = xlrd.open_workbook(u'Python 进行数据分析测试. xls')
- sheet_names= workbook.sheet_names()
- forsheet_nameinsheet_names:
- sheet2 = workbook.sheet_by_name(sheet_name)
- printsheet_name rows = sheet2.row_values(1)
- cols = sheet2.col_values(1)
- printrows
- printcols
- importxlwt
- wbk = xlwt.Workbook()
- sheet = wbk.add_sheet('sheet 1')
- sheet.write(0,1,'test text')# 第 0 行第一列写入内容
- wbk.save('test.xls')
- importxlrd
- fromxlutils.copyimportcopy
- workbook = xlrd.open_workbook(u'Python 进行数据分析测试. xls')
- workbooknew = copy(workbook)
- ws = workbooknew.get_sheet(0)
- ws.write(3,0,'changed!')
- workbooknew.save(u'Python 进行数据分析测试 copy.xls')
- fromopenpyxlimportWorkbook
- fromopenpyxlimportload_workbook
- fromopenpyxl.writer.excelimportExcelWriter
- workbook_ = load_workbook(u"Python 进行数据分析测试. xlsx")
- sheetnames =workbook_.get_sheet_names()
- printsheetnames
- sheet = workbook_.get_sheet_by_name(sheetnames[0])
- printsheet.cell(row=3,column=3).value
- sheet['A1'] ='47'
- workbook_.save(u"Python 进行数据分析测试新. xlsx")
- wb = Workbook()
- ws = wb.active
- ws['A1'] =4
- wb.save("检索. xlsx")
来源: http://www.jianshu.com/p/069ee09358fe