如何优雅的解决群友的 Python 问题?

01 问题描述

这个问题来源于自己 Python 交流群中的一个问题, 如下图所示, 需要计算每列中各值的出现次数, 然后组成一个新的表.

02 解决思路

计算每列各值的出现次数, 我们可以使用 groupby 方法, 当然最简单的还是使用 value_counts 方法.

首先读取数据

接着使用一个循环语句, 依次计算每列的值计算

(由于每列的值计数返回的是 series 数据, 而且我们也需要在结果表中的一列加上列名), 构建每列值计数的 dataframe.

最后将这些 dataframe 合并即可.

03 解决代码

import pandas as pd
data = pd.read_excel('例子. xlsx',sheetname='Sheet1',index_col='index')
frames = []
for i in data.columns:
    s = data[i].value_counts().sort_values()
    d = pd.DataFrame({'列名':i,'变量名':s.index,'次数':s.values})
    frames.append(d)
result = pd.concat(frames)
result

这样, 就可以通过不到 10 行的代码就可以优雅的解决群友的问题啦, 不得不说 Python 以及 pandas 的强大了.

来源: http://www.jianshu.com/p/054eeedf72d8

与本文相关文章

暂无,快来抢沙发吧！