雷锋网 (公众号: 雷锋网) AI 科技评论按: 这是 Karlijn Willems 发布于 Medium 的一篇关于 Python 中数据导入问题的博客 Karlijn Willems 是来自于 DataCamp 的数据科学研究员她在本文中介绍一份 Python 中数据导入操作的速查表, 雷锋网 AI 科技评论对原文进行了编译
借助这个 Python 速查表, 你将拥有一份便捷的数据导入参考指南该速查表全面涵盖了 平面文件 (Flat files) 其它软件所定义的原生文件类型以及关系型数据库数据 的导入方法
在你对数据进行清理可视化等操作之前, 我们首先需要实现的事情是使用 Python 导入数据而众所周知, 针对不同的数据文件存在着许多不同的导入方法
但是, 你最经常使用的库可能就是 Pandas 和 Numpy:Pandas 库是最受数据科学家喜爱的软件库之一, 他们经常 使用 Pandas 对数据进行操作和分析 , 然后再使用 matplotlib 进行数据可视化 而 Numpy 则是 Python 中进行科学计算的一个基础库, 并且 Pandas 也是构建于 Numpy 之上的
在这份数据导入速查表中, 你将看到一些 Numpy 和 Pandas 的函数, 以及使用 Python 语言编写的函数, 这些都将帮助你更快捷地将数据导入 Python
这份教程将帮助你快速学习和掌握将数据导入 Python 中的基础操作, 以便于你可以对数据开展后续的清理和可视化等操作
速查表 传送门
这份速查表将引导你学习掌握如何将数据导入实验环境的基础: 你不仅会学到如何导入诸如文本文件这样的平面文件, 也能看到如何读取那些来自于特定软件的文件 (比如 ExcelStataSAS 和 MATLAB) 和关系型数据库最重要的是, 你将获得更多关于如何寻求帮助的指示, 如何浏览文件系统以及如何开始探索数据信息
总而言之, 这里有你所需要的所有知识, 来帮助你开启基于 Python 的数据科学学习大门
如果你还想获得更多的知识, 那么现在可以免费来学习这门 Python 数据导入课程 或者尝试一下我们的 使用 Python 玩转 Excel 教学 !
当然, 别忘了我们为数据科学而制作的 Python 速查表 , 并且在我们的 社区 能获得更多类似的速查表!
来源: http://www.tuicool.com/articles/yie2yuF