Pandas Series
什么是 Series?
Pandas Series 就像表格中的一列。
它是一维数组,可以容纳任何类型的数据。
实例
从列表创建一个简单的 Pandas Series:
import pandas as pd a = [1, 7, 2] myvar = pd.Series(a) print(myvar)
标签(Labels)
如果没有指定其他内容,则使用索引号为值标记。第一个值的索引为 0,第二个值的索引为 1,依此类推。
此标签可用于访问指定的值。
实例
返回 Series 的第一个值:
print(myvar[0])
创建标签
使用 index
参数,您可以命名自己的标签。
实例
创建您自己的标签:
import pandas as pd a = [1, 7, 2] myvar = pd.Series(a, index = ["x", "y", "z"]) print(myvar)
创建标签后,您可以通过引用标签来访问项目。
实例
返回 "y" 的值:
print(myvar["y"])
作为 Series 的键/值对象
在创建 Series 时,您还可以使用键/值对象,如字典。
实例
从字典创建一个简单的 Pandas Series:
import pandas as pd calories = {"day1": 420, "day2": 380, "day3": 390} myvar = pd.Series(calories) print(myvar)
注意:字典的键成为标签。
若要选择字典中的某些项,请使用 index
参数并仅指定要包含在 Series 中的项。
实例
仅使用 "day1" 和 "day2" 的数据创建一个 Series:
import pandas as pd calories = {"day1": 420, "day2": 380, "day3": 390} myvar = pd.Series(calories, index = ["day1", "day2"]) print(myvar)
数据帧(DataFrames)
Pandas 中的数据集通常是多维表,称为数据帧。
Series 就像一列,而数据帧是整个表。
实例
从两个 Series 创建一个数据帧:
import pandas as pd data = { "calories": [420, 380, 390], "duration": [50, 40, 45] } myvar = pd.DataFrame(data) print(myvar)
您将在下一章中了解 DataFrame。