Pandas Series

什么是 Series?

Pandas Series 就像表格中的一列。

它是一维数组,可以容纳任何类型的数据。

实例

从列表创建一个简单的 Pandas Series:

import pandas as pd

a = [1, 7, 2]

myvar = pd.Series(a)

print(myvar)

亲自试一试

标签(Labels)

如果没有指定其他内容,则使用索引号为值标记。第一个值的索引为 0,第二个值的索引为 1,依此类推。

此标签可用于访问指定的值。

实例

返回 Series 的第一个值:

print(myvar[0])

亲自试一试

创建标签

使用 index 参数,您可以命名自己的标签。

实例

创建您自己的标签:

import pandas as pd

a = [1, 7, 2]

myvar = pd.Series(a, index = ["x", "y", "z"])

print(myvar)

亲自试一试

创建标签后,您可以通过引用标签来访问项目。

实例

返回 "y" 的值:

print(myvar["y"])

亲自试一试

作为 Series 的键/值对象

在创建 Series 时,您还可以使用键/值对象,如字典。

实例

从字典创建一个简单的 Pandas Series:

import pandas as pd

calories = {"day1": 420, "day2": 380, "day3": 390}

myvar = pd.Series(calories)

print(myvar)

亲自试一试

注意:字典的键成为标签。

若要选择字典中的某些项,请使用 index 参数并仅指定要包含在 Series 中的项。

实例

仅使用 "day1" 和 "day2" 的数据创建一个 Series:

import pandas as pd

calories = {"day1": 420, "day2": 380, "day3": 390}

myvar = pd.Series(calories, index = ["day1", "day2"])

print(myvar)

亲自试一试

数据帧(DataFrames)

Pandas 中的数据集通常是多维表,称为数据帧。

Series 就像一列,而数据帧是整个表。

实例

从两个 Series 创建一个数据帧:

import pandas as pd

data = {
  "calories": [420, 380, 390],
  "duration": [50, 40, 45]
}

myvar = pd.DataFrame(data)

print(myvar)

亲自试一试

您将在下一章中了解 DataFrame