
如果用于数据分析建议使用Anaconda,它自带Pandas Numy 以及很多库,还有集成开发环境Spyder(自带的变量查看器很好用),Windows、Linux、Mac操作系统均支持。
最常用的安装Pandas的方法是通过Anaconda安装。
大多时候Pandas都被使用者输入为pd,其实Pandas是panel data的缩写(而不是指熊猫):
import numpy as np # pandas和numpy常常结合在一起使用,导入numpy库
import pandas as pd # 导入pandas库
print(pd.__version__) # 打印pandas版本信息
Pandas包含两种数据类型,即Series和DataFrame。
Series是一种一维数据结构,每个元素都带有一个索引,与一维数组的含义相似,其中索引可以为数字或字符串。
DataFrame是一种二维数据结构,数据以表格形式(与Excel类似)存储,有对应的行和列。
(1)从Excel中读取数据。
(2)从csv中读取数据。
(1)增删列。
(2)改列名。
(3)改index。
(4)编辑值(计算值)。
(5)查列。
(6)去重。
(1)输出到csv。
(2)输出到Excel。
(3)输出到数据库。
(1)创建现在的时间点为对象。
(2)时间的位移。
(3)调整格式。
(4)工作日的计算。