Python Pandas 简明教程

Python Pandas - Introduction

Pandas 是一个开源 Python 库,通过其强大的数据结构提供高性能数据操作和分析工具。Pandas 名称源自术语面板数据 - 多维数据计量经济学。

2008 年,开发人员 Wes McKinney 开始开发 pandas,当时需要高性能、灵活的工具来分析数据。

在 Pandas 之前,Python 主要用于数据整理和准备。它对数据分析的贡献极小。Pandas 解决这个问题。使用 Pandas,我们可以完成数据处理和分析中的五个典型步骤,无论数据的来源如何 - 加载、准备、操作、建模和分析。

带有 Pandas 的 Python 用于广泛的领域,包括学术和商业领域,包括金融、经济学、统计学、分析等。

Key Features of Pandas

  1. 使用默认和自定义索引的快速高效的数据框对象。

  2. 将数据从不同文件格式加载到内存数据对象中的工具。

  3. 数据对齐和缺失数据的集成处理。

  4. 重新整形和旋转数据集。

  5. 基于标签的大数据集的切片、索引和子集。

  6. 可以删除或插入数据结构的列。

  7. 按数据分组进行聚合和转换。

  8. 高性能的数据合并和连接。

  9. Time Series functionality.