全站搜索未启用
跳到主要内容

9.2.1安装Pandas

如果用于数据分析建议使用Anaconda,它自带Pandas Numy 以及很多库,还有集成开发环境Spyder(自带的变量查看器很好用),Windows、Linux、Mac操作系统均支持。

最常用的安装Pandas的方法是通过Anaconda安装。

9.2.2导入Pandas库和查询相应的版本信息

大多时候Pandas都被使用者输入为pd,其实Pandas是panel data的缩写(而不是指熊猫):

import numpy as np   # pandas和numpy常常结合在一起使用,导入numpy库

import pandas as pd  # 导入pandas库

print(pd.__version__) # 打印pandas版本信息

9.2.3 Pandas数据类型

Pandas包含两种数据类型,即Series和DataFrame。

Series是一种一维数据结构,每个元素都带有一个索引,与一维数组的含义相似,其中索引可以为数字或字符串。

DataFrame是一种二维数据结构,数据以表格形式(与Excel类似)存储,有对应的行和列。

9.2.4读取数据

(1)从Excel中读取数据。

(2)从csv中读取数据。

9.2.5增删改查

(1)增删列。

(2)改列名。

(3)改index。

(4)编辑值(计算值)。

(5)查列。

(6)去重。

9.2.6数据输出

(1)输出到csv。

(2)输出到Excel。

(3)输出到数据库。

9.2.7使用DateTime进行时间相关的操作

(1)创建现在的时间点为对象。

(2)时间的位移。

(3)调整格式。

(4)工作日的计算。

最后修改: 2020年02月4日 Tuesday 17:04