网站首页 > 技术文章 正文
如果你想充分发挥Python的强大作用,如果你想成为一名好的Python量化师,你应该先学好Pandas。今天就来了解什么是Pandas。
与numpy 易于处理同种类型数据不同,pandas更加的适合处理不同类型的数据,类似于excel表格,每行每列都有相应的名称。特点是拥有便捷的数据处理能力、独特的数据结构、读取文件方便、封装了matplotlib的画图和numpy的计算
pandas主要的数据结构为series和dataframe。
一、Series
Series类似表格中的一个列(column),类似于一维数组,可以保存任何数据类型。
Series 定义为一维的数组型python对象,不仅具有值序列而且还包含相应的数据标签index。默认的索引下标为从0到n-1。可以通过values 和index 属性来索引series 对象。也可以将其认为是字典类型的一种变体,因为series 相应的索引值和数据值按位置配对。
二、DataFrame
DataFrame 是一个表格型的数据结构,类似于excel表格,具有行列索引。也可将其看做矩阵化的数据表,可以包含不同数据类型的数据。每列可以是不同的值类型(数值、字符串、布尔型值)。
DataFrame 既有行索引也有列索引,它可以被看做由Series组成的字典。二维的DataFrame 通过分层索引可以实现更高维的索引。
三、Pandas画图
用Pandas画图前,需要了解一下它的基础操作:
对象:plot(x=None,y=None,kind=‘line’)
x和y表示标签或者位置,默认为None
kind:表示绘图的类型,默认为line,折线图
line:折线图
bar/barh:柱状图
hist:直方图
pie:饼状图
area:区域图
scatter:散点图
四、Pandas文件的读取和存储
pandas支持的常用文件类型包括:HDF5、CSV、SQL、XLS、JSON等。
(1)CSV
pd.read_csv(‘filepath_or_buffer’, usecols=[]) 读取csv文件数据。
- filepath_or_buffer:文件路径
- Sep:分隔符,默认为’,’
- usecols:指定读取的列名,列表形式
df.to_csv(path_or_buf,columns=[],index=True,mode=‘w’) 将数据存储到csv文件中。
- path_or_buf:文件存放的路径
- sep:分隔符,默认为’,’
- columns:列,列表形式
- mode:‘w’:重写,‘a’:追加
- header:是否写进列索引值
- index:是否写进行索引,默认True写进行索引,会将行索引变成一列数据
- encoding:编码格式,默认为None
- HDF5
读取HDF5文件(.h5)需要安装tables模块。
pd.read_hdf(path_or_buf, key=None) 读取HDF5文件
- path_or_buf:文件路径
- key:读取的键
df.to_hdf(path_or_buf, key) 写入HDF5文件
- path_or_buf:文件路径
- key:写入文件时,必须指定一个键
(3)JSON
pd.read_jsonf(path_or_buf, orient=None,typ=‘frame’,lines=False) 读取json文件
- path_or_buf:文件路径
- orient:指定数据存储的json形式 ,{‘split’,‘records’,‘index’,‘columns’,‘valuse’}
- typ:默认frame,指定转换成的对象类型Series或者DataFrame
- lines:默认False,按照每行读取json
pd.to_jsonf(path_or_buf, orient=None,lines=False) 存储json文件
- path_or_buf:文件路径
- orient:指定数据存储的json形式
- lines:默认False,一个对象存储为一行。一般设置为Ture
- 上一篇: 分享一个用于商业决策数据挖掘的python案例
- 下一篇:已经是最后一篇了
猜你喜欢
- 2025-06-08 分享一个用于商业决策数据挖掘的python案例
- 2025-06-08 Python图像识别实战(二):批量图像读取和像素转换(附源码)
- 2025-06-08 从小白到大神,这10个超实用的 Python 编程技巧不可少
- 2025-06-08 太震撼!527页战略级Python机器学习实战,实用度碾压群书!附PDF
- 2025-06-08 一篇文章带你解析Python进程(一篇文章带你解析python进程怎么写)
- 2025-06-08 大数据分析师如何进行数据挖掘?大数据分析师丨 2025 年报考攻略
- 264℃Python短文,Python中的嵌套条件语句(六)
- 263℃python笔记:for循环嵌套。end=""的作用,图形打印
- 261℃PythonNet:实现Python与.Net代码相互调用!
- 256℃Python操作Sqlserver数据库(多库同时异步执行:增删改查)
- 256℃Python实现字符串小写转大写并写入文件
- 116℃原来2025是完美的平方年,一起探索六种平方的算吧
- 96℃Python 和 JavaScript 终于联姻了!PythonMonkey 要火?
- 89℃Ollama v0.4.5-v0.4.7 更新集合:Ollama Python 库改进、新模型支持
- 最近发表
-
- 金母鸡量化教学场:pandas—数据挖掘的Python库
- 分享一个用于商业决策数据挖掘的python案例
- Python图像识别实战(二):批量图像读取和像素转换(附源码)
- 从小白到大神,这10个超实用的 Python 编程技巧不可少
- 太震撼!527页战略级Python机器学习实战,实用度碾压群书!附PDF
- 一篇文章带你解析Python进程(一篇文章带你解析python进程怎么写)
- 大数据分析师如何进行数据挖掘?大数据分析师丨 2025 年报考攻略
- UG编程第34节:浅谈机床坐标系(ug编程机床坐标系细节)
- 想入门Python?先狠下心来死磕这7个方向
- Python大屏看板最全教程之Pyecharts图表
- 标签列表
-
- python中类 (31)
- python 迭代 (34)
- python 小写 (35)
- python怎么输出 (33)
- python 日志 (35)
- python语音 (31)
- python 工程师 (34)
- python3 安装 (31)
- python音乐 (31)
- 安卓 python (32)
- python 小游戏 (32)
- python 安卓 (31)
- python聚类 (34)
- python向量 (31)
- python大全 (31)
- python次方 (33)
- python桌面 (32)
- python总结 (34)
- python浏览器 (32)
- python 请求 (32)
- python 前端 (32)
- python验证码 (33)
- python 题目 (32)
- python 文件写 (33)
- python中的用法 (32)