建网站做seo网站欢迎页制作
在 Python 中,pandas.core.frame.DataFrame 是 Pandas 数据库的核心数据结构,可以方便地读取和操作表格数据。以下是几种常见的读取内容的方法:
读取特定列
通过列名获取数据。
# 假设 df 是一个 DataFrame
data = df["列名"]  # 获取某一列,返回一个 Series 对象
data_list = df["列名"].tolist()  # 将某一列转为 Python 列表
 
示例:
# 假设表格如下:
#   A    B    C
# 0  1    4    7
# 1  2    5    8
# 2  3    6    9data = df["A"]  # 返回 A 列
# 输出:
# 0    1
# 1    2
# 2    3
# Name: A, dtype: int64data_list = df["A"].tolist()
# 输出:
# [1, 2, 3]
 
读取多列
传递列名列表,获取多个列。
selected_columns = df[["列名1", "列名2"]]
 
示例:
selected_columns = df[["A", "B"]]
# 输出:
#    A  B
# 0  1  4
# 1  2  5
# 2  3  6
 
读取特定行
使用索引或切片访问行数据。
row = df.loc[索引值]  # 根据标签(行号)读取某一行
row = df.iloc[索引值]  # 根据整数位置读取某一行
rows = df.iloc[起始行:结束行]  # 切片读取多行
 
示例:
row = df.loc[1]  # 返回索引为 1 的行
# 输出:
# A    2
# B    5
# C    8
# Name: 1, dtype: int64rows = df.iloc[0:2]  # 返回前两行
# 输出:
#    A  B  C
# 0  1  4  7
# 1  2  5  8
 
读取特定单元格
使用 .at 或 .iat 方法。
value = df.at[行索引, "列名"]  # 根据标签读取
value = df.iat[行位置, 列位置]  # 根据整数位置读取
 
示例:
value = df.at[1, "A"]  # 获取第 1 行,A 列的值
# 输出:2value = df.iat[1, 0]  # 获取第 1 行,第 0 列的值
# 输出:2
 
按条件读取
通过布尔索引读取符合条件的数据。
filtered = df[df["列名"] > 条件值]  # 返回满足条件的行
 
示例:
filtered = df[df["A"] > 1]
# 输出:
#    A  B  C
# 1  2  5  8
# 2  3  6  9
 
遍历 DataFrame
如果需要逐行处理,可以使用以下方式:
方法 1:iterrows()(按行遍历)
 
for index, row in df.iterrows():print(index, row["列名1"], row["列名2"])
 
方法 2:itertuples()(更高效)
 
for row in df.itertuples():print(row.Index, row.列名1, row.列名2)
 
示例:
for index, row in df.iterrows():print(f"第 {index} 行: {row['A']}, {row['B']}, {row['C']}")
 
读取整体数据
- 查看 DataFrame 头部:
print(df.head()) # 默认显示前 5 行 print(df.head(10)) # 显示前 10 行 - 转换为 NumPy 数组:
array = df.values - 查看数据类型:
print(df.dtypes) 
如果需要进一步操作,可以根据具体场景扩展!
