Pandas DataFrame

什么是 DataFrame?

Pandas DataFrame 是二维数据结构,就像二维数组,或者带有行和列的表格。

实例

创建一个简单的 Pandas DataFrame:

import pandas as pd

data = {
  "calories": [420, 380, 390],
  "duration": [50, 40, 45]
}

# 将数据加载到 DataFrame 对象中:
df = pd.DataFrame(data)

print(df) 

亲自试一试

结果

   calories  duration
0       420        50
1       380        40
2       390        45

定位行

从上面的结果可以看出,DataFrame 就像一个有行和列的表格。

Pandas 使用 loc 属性返回一行或多行指定行。

实例

返回第 0 行:

# 引用行索引:
print(df.loc[0])

亲自试一试

结果

calories    420
duration     50
Name: 0, dtype: int64

注意:此例返回一个 Pandas Series

实例

返回第 0 行和第 1 行:

#使用索引列表:
print(df.loc[[0, 1]])

亲自试一试

结果

   calories  duration
0       420        50
1       380        40

注意:当使用 [] 时,结果是 Pandas DataFrame

命名索引

使用 index 参数,您可以命名自己的索引。

实例

添加一个名称列表,为每一行命名:

import pandas as pd

data = {
  "calories": [420, 380, 390],
  "duration": [50, 40, 45]
}

df = pd.DataFrame(data, index = ["day1", "day2", "day3"])

print(df) 

亲自试一试

结果

      calories  duration
day1       420        50
day2       380        40
day3       390        45

定位命名索引

loc 属性中使用命名索引来返回指定的行。

实例

返回 "day2":

Return "day2":

#引用命名索引:
print(df.loc["day2"])

亲自试一试

结果

calories    380
duration     40
Name: day2, dtype: int64

将文件加载到 DataFrame 中

如果您的数据集存储在文件中,Pandas 可以将它们加载到 DataFrame 中。

实例

将逗号分隔的文件(CSV 文件)加载到 DataFrame 中:

import pandas as pd

df = pd.read_csv('data.csv')

print(df) 

亲自试一试

提示:您将在接下来的章节中了解有关导入文件的更多信息。