Pandas DataFrame
什么是 DataFrame?
Pandas DataFrame 是二维数据结构,就像二维数组,或者带有行和列的表格。
实例
创建一个简单的 Pandas DataFrame:
import pandas as pd data = { "calories": [420, 380, 390], "duration": [50, 40, 45] } # 将数据加载到 DataFrame 对象中: df = pd.DataFrame(data) print(df)
结果
calories duration 0 420 50 1 380 40 2 390 45
定位行
从上面的结果可以看出,DataFrame 就像一个有行和列的表格。
Pandas 使用 loc
属性返回一行或多行指定行。
实例
返回第 0 行:
# 引用行索引: print(df.loc[0])
结果
calories 420 duration 50 Name: 0, dtype: int64
注意:此例返回一个 Pandas Series。
实例
返回第 0 行和第 1 行:
#使用索引列表: print(df.loc[[0, 1]])
结果
calories duration 0 420 50 1 380 40
注意:当使用 []
时,结果是 Pandas DataFrame。
命名索引
使用 index
参数,您可以命名自己的索引。
实例
添加一个名称列表,为每一行命名:
import pandas as pd data = { "calories": [420, 380, 390], "duration": [50, 40, 45] } df = pd.DataFrame(data, index = ["day1", "day2", "day3"]) print(df)
结果
calories duration day1 420 50 day2 380 40 day3 390 45
定位命名索引
在 loc
属性中使用命名索引来返回指定的行。
实例
返回 "day2":
Return "day2": #引用命名索引: print(df.loc["day2"])
结果
calories 380 duration 40 Name: day2, dtype: int64
将文件加载到 DataFrame 中
如果您的数据集存储在文件中,Pandas 可以将它们加载到 DataFrame 中。
实例
将逗号分隔的文件(CSV 文件)加载到 DataFrame 中:
import pandas as pd df = pd.read_csv('data.csv') print(df)
提示:您将在接下来的章节中了解有关导入文件的更多信息。