在本文中,我们将探索两种不同的方法,以便在 R 语言中从 CSV 文件仅导入数据的选定列。
方法 1:使用 read.table() 函数
在这种方法中,为了仅导入 CSV 文件数据的选定列,我们需要调用 read.table() 函数。这是 R 语言的一个内置函数,通过在其参数中指定要选择的列,我们可以从数据中导入特定的列。在这里,我们需要将参数设置为 null 值,以避免导入某些特定的列。
read.table() 函数以表格格式读取文件并据此创建一个数据框,其中数据行对应文件中的行,变量对应文件中的字段。
> 语法:
>
>
> read.table(file, header, nrows, skip, colClasses, sep)
>
>
> 参数:
>
>
> – file: 指定文件的名称(路径)。
> – header: 这是一个逻辑标志,指示第一行是否为包含变量名的标题行。
> – nrows: 指定数据集中要读取的行数。
> – skip: 用于从文件开头开始跳过特定的行数。
> – colClasses: 这是一个字符向量,用于指示数据集中每一列的数据类型(类)。
> – sep: 这是一个字符串,指示列之间的分隔方式,例如逗号、空格、冒号、制表符等。
使用的示例数据集:
示例:
R
CODEBLOCK_9a891e93
输出:
方法 2:使用 data.table 包中的 fread() 函数
在这种将选定列导入 R 语言的方法中,我们首先需要在 R 控制台中安装并导入 INLINECODE8aae626a 包,然后调用该包中的 INLINECODE37784efe 函数。通过在 select 参数中传入文件位置和我们需要导入的选定列名,我们就可以轻松地读取特定的数据。
INLINECODE2fe410ff 函数非常快速且便捷,像分隔符 (INLINECODE59d85b5e)、列类型 (INLINECODEbf6055a9) 和行数 (INLINECODE4852e323) 这样的控制参数通常都会被自动检测。
> 语法:
>
>
> fread(file, sep, colClasses, nrows)
>
>
> 参数:
>
>
> – file: 指定文件的名称(路径)。
> – colClasses: 这是一个字符向量,用于指示数据集中每一列的数据类型(类)。
> – sep: 这是一个字符串,指示列之间的分隔方式,例如逗号、空格、冒号、制表符等。
> – nrows: 指定数据集中要读取的行数。
示例:
R
CODEBLOCK_042dcb1d
输出: