Pandas 数据框列选择指南

在 Pandas 中选择数据框(DataFrame)中的特定列或多个列,最简单的方法是使用括号表示法,即将列名放在方括号内。让我们来看看下面的例子:

Python


CODEBLOCK_931b2f2a

Output

0    25
1    30
2    22
3    35
4    28
Name: Age, dtype: int64

这种方法允许我们轻松访问单列数据。现在,让我们尝试选择多列,我们需要在双层方括号内传递一个列名列表。

Python


CODEBLOCK_eca522aa

Output

Age  Salary
0   25   50000
1   30   55000
2   22   40000
3   35   70000
4   28   48000

这种方法使我们能够同时选择和操作多个列。

除了这个方法外,还有几种其他方法可以在 Pandas DataFrame 中选择列:

1. 使用 loc 选择列

[loc[]](https://www.geeksforgeeks.org/python/python-pandas-dataframe-loc/) 方法通过标签选择行和列。当我们想使用标签选择特定列时,可以使用此方法高效地检索所需的列。

Python


CODEBLOCK_0126dade

Output

Name  Gender
0     John    Male
1    Alice  Female
2      Bob    Male
3      Eve  Female
4  Charlie    Male

2. 使用 iloc 选择列

[iloc[]](https://www.geeksforgeeks.org/python/python-extracting-rows-using-pandas-iloc/) 方法用于通过整数索引位置选择行和列。当我们知道列的位置而不是名称时,这非常有用。

Python


CODEBLOCK_e48621e1

Output

Name  Age
0     John   25
1    Alice   30
2      Bob   22
3      Eve   35
4  Charlie   28

3. 使用 filter 选择列

filter() 方法在我们希望根据特定条件(例如列名匹配特定模式)选择列时非常有用。我们可以使用此方法来选择包含特定子字符串或匹配正则表达式的列。

Python


CODEBLOCK_28942d2b

Output

Age
0   25
1   30
2   22
3   35
4   28

4. 根据数据类型选择列

如果我们想根据数据类型选择列(例如,仅选择数值列),可以使用 <a href="https://www.geeksforgeeks.org/python/python-pandas-dataframe-selectdtypes/">selectdtypes()<a href="https://www.geeksforgeeks.org/python/python-pandas-dataframe-selectdtypes/">https://www.geeksforgeeks.org/python/python-pandas-dataframe-selectdtypes/ 方法。

Python


CODEBLOCK_f87b1f7f

Output

Age  Salary
0   25   50000
1   30   55000
2   22   40000
3   35   70000
4   28   48000

以下是一些关键要点:

  • 使用括号表示法 (df[‘column_name‘]) 选择单个列。
  • 使用双层方括号 (df[[‘column1‘, ‘column2‘]]) 选择多个列。
  • 探索 loc[], iloc[], filter(), select_dtypes() 以使用基于标签、位置或条件的更高级的选择技术。
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。如需转载,请注明文章出处豆丁博客和来源网址。https://shluqu.cn/29081.html
点赞
0.00 平均评分 (0% 分数) - 0