在 Pandas 中选择数据框(DataFrame)中的特定列或多个列,最简单的方法是使用括号表示法,即将列名放在方括号内。让我们来看看下面的例子:
Python
CODEBLOCK_931b2f2a
Output
0 25
1 30
2 22
3 35
4 28
Name: Age, dtype: int64
这种方法允许我们轻松访问单列数据。现在,让我们尝试选择多列,我们需要在双层方括号内传递一个列名列表。
Python
CODEBLOCK_eca522aa
Output
Age Salary
0 25 50000
1 30 55000
2 22 40000
3 35 70000
4 28 48000
这种方法使我们能够同时选择和操作多个列。
除了这个方法外,还有几种其他方法可以在 Pandas DataFrame 中选择列:
1. 使用 loc 选择列
[loc[]](https://www.geeksforgeeks.org/python/python-pandas-dataframe-loc/) 方法通过标签选择行和列。当我们想使用标签选择特定列时,可以使用此方法高效地检索所需的列。
Python
CODEBLOCK_0126dade
Output
Name Gender
0 John Male
1 Alice Female
2 Bob Male
3 Eve Female
4 Charlie Male
2. 使用 iloc 选择列
[iloc[]](https://www.geeksforgeeks.org/python/python-extracting-rows-using-pandas-iloc/) 方法用于通过整数索引位置选择行和列。当我们知道列的位置而不是名称时,这非常有用。
Python
CODEBLOCK_e48621e1
Output
Name Age
0 John 25
1 Alice 30
2 Bob 22
3 Eve 35
4 Charlie 28
3. 使用 filter 选择列
filter() 方法在我们希望根据特定条件(例如列名匹配特定模式)选择列时非常有用。我们可以使用此方法来选择包含特定子字符串或匹配正则表达式的列。
Python
CODEBLOCK_28942d2b
Output
Age
0 25
1 30
2 22
3 35
4 28
4. 根据数据类型选择列
如果我们想根据数据类型选择列(例如,仅选择数值列),可以使用 <a href="https://www.geeksforgeeks.org/python/python-pandas-dataframe-selectdtypes/">selectdtypes()<a href="https://www.geeksforgeeks.org/python/python-pandas-dataframe-selectdtypes/">https://www.geeksforgeeks.org/python/python-pandas-dataframe-selectdtypes/ 方法。
Python
CODEBLOCK_f87b1f7f
Output
Age Salary
0 25 50000
1 30 55000
2 22 40000
3 35 70000
4 28 48000
以下是一些关键要点:
- 使用括号表示法 (df[‘column_name‘]) 选择单个列。
- 使用双层方括号 (df[[‘column1‘, ‘column2‘]]) 选择多个列。
- 探索 loc[], iloc[], filter(), 和 select_dtypes() 以使用基于标签、位置或条件的更高级的选择技术。