在 R 语言中从 CSV 文件仅导入选定列数据的两种方法

在本文中,我们将探索两种不同的方法,以便在 R 语言中从 CSV 文件仅导入数据的选定列。

方法 1:使用 read.table() 函数

在这种方法中,为了仅导入 CSV 文件数据的选定列,我们需要调用 read.table() 函数。这是 R 语言的一个内置函数,通过在其参数中指定要选择的列,我们可以从数据中导入特定的列。在这里,我们需要将参数设置为 null 值,以避免导入某些特定的列。

read.table() 函数以表格格式读取文件并据此创建一个数据框,其中数据行对应文件中的行,变量对应文件中的字段。

> 语法:

>

>

> read.table(file, header, nrows, skip, colClasses, sep)

>

>

> 参数:

>

>

> – file: 指定文件的名称(路径)。

> – header: 这是一个逻辑标志,指示第一行是否为包含变量名的标题行。

> – nrows: 指定数据集中要读取的行数。

> – skip: 用于从文件开头开始跳过特定的行数。

> – colClasses: 这是一个字符向量,用于指示数据集中每一列的数据类型(类)。

> – sep: 这是一个字符串,指示列之间的分隔方式,例如逗号、空格、冒号、制表符等。

使用的示例数据集:

!image

示例:

R


CODEBLOCK_9a891e93

输出:

!image

方法 2:使用 data.table 包中的 fread() 函数

在这种将选定列导入 R 语言的方法中,我们首先需要在 R 控制台中安装并导入 INLINECODE8aae626a 包,然后调用该包中的 INLINECODE37784efe 函数。通过在 select 参数中传入文件位置和我们需要导入的选定列名,我们就可以轻松地读取特定的数据。

INLINECODE2fe410ff 函数非常快速且便捷,像分隔符 (INLINECODE59d85b5e)、列类型 (INLINECODEbf6055a9) 和行数 (INLINECODE4852e323) 这样的控制参数通常都会被自动检测。

> 语法:

>

>

> fread(file, sep, colClasses, nrows)

>

>

> 参数:

>

>

> – file: 指定文件的名称(路径)。

> – colClasses: 这是一个字符向量,用于指示数据集中每一列的数据类型(类)。

> – sep: 这是一个字符串,指示列之间的分隔方式,例如逗号、空格、冒号、制表符等。

> – nrows: 指定数据集中要读取的行数。

示例:

R


CODEBLOCK_042dcb1d

输出:

!image

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。如需转载,请注明文章出处豆丁博客和来源网址。https://shluqu.cn/24414.html
点赞
0.00 平均评分 (0% 分数) - 0