Pandas DataFrame

什么是 DataFrame？

Pandas DataFrame 是二维数据结构，就像二维数组，或者带有行和列的表格。

实例

创建一个简单的 Pandas DataFrame：

import pandas as pd

data = {
  "calories": [420, 380, 390],
  "duration": [50, 40, 45]
}

# 将数据加载到 DataFrame 对象中：
df = pd.DataFrame(data)

print(df)

亲自试一试

结果

   calories  duration
0       420        50
1       380        40
2       390        45

定位行

从上面的结果可以看出，DataFrame 就像一个有行和列的表格。

Pandas 使用 loc 属性返回一行或多行指定行。

实例

返回第 0 行：

# 引用行索引：
print(df.loc[0])

亲自试一试

结果

calories    420
duration     50
Name: 0, dtype: int64

注意：此例返回一个 Pandas Series。

实例

返回第 0 行和第 1 行：

#使用索引列表：
print(df.loc[[0, 1]])

亲自试一试

结果

   calories  duration
0       420        50
1       380        40

注意：当使用 [] 时，结果是 Pandas DataFrame。

命名索引

使用 index 参数，您可以命名自己的索引。

实例

添加一个名称列表，为每一行命名：

import pandas as pd

data = {
  "calories": [420, 380, 390],
  "duration": [50, 40, 45]
}

df = pd.DataFrame(data, index = ["day1", "day2", "day3"])

print(df)

亲自试一试

结果

      calories  duration
day1       420        50
day2       380        40
day3       390        45

定位命名索引

在 loc 属性中使用命名索引来返回指定的行。

实例

返回 "day2"：

Return "day2":

#引用命名索引：
print(df.loc["day2"])

亲自试一试

结果

calories    380
duration     40
Name: day2, dtype: int64

将文件加载到 DataFrame 中

如果您的数据集存储在文件中，Pandas 可以将它们加载到 DataFrame 中。

实例

将逗号分隔的文件（CSV 文件）加载到 DataFrame 中：

import pandas as pd

df = pd.read_csv('data.csv')

print(df)

亲自试一试

提示：您将在接下来的章节中了解有关导入文件的更多信息。