Pandas 实战指南：如何优雅地从日期时间序列中提取星期几

2026-02-05 15:39:45 0条评论 86次阅读 0人点赞

在数据科学和日常的数据分析工作中，我们经常需要对时间序列数据进行深入挖掘。你肯定遇到过这样的情况：手里有一堆包含时间戳的数据，但你并不关心具体的几点几分，而是更想知道这些事情发生在一周中的哪一天。比如，你想分析电商平台的订单是更倾向于在工作日达成，还是在周末爆发？或者你想看看服务器宕机是否总是发生在星期二？

为了解决这类问题，Pandas 为我们提供了强大且便捷的工具——Series.dt.dayofweek 属性。在这篇文章中，我们将不仅回顾基础用法，还会融入 2026 年最新的工程化视角，探讨在 AI 辅助编程和大规模数据处理时代，如何高效、稳健地使用这个属性。无论你是刚入门的数据分析师，还是希望提升代码效率的资深开发者，这篇文章都将为你提供实用的见解和技巧。

理解 `dt.dayofweek` 的基础

首先，让我们明确一下 dt.dayofweek 到底返回什么。在 Pandas 中，当你使用这个属性时，它会返回一个整数值，代表星期几。这一点非常关键，因为不同的编程语言或系统中，星期的起始可能不同。

在 Pandas 的默认设定中：

0 代表 星期一
1 代表 星期二
2 代表 星期三
3 代表 星期四
4 代表 星期五
5 代表 星期六
6 代表 星期日

这种编号方式（从 0 到 6）非常符合计算机科学的逻辑，但在进行数据可视化或生成报告时，我们通常需要将其转换回人类可读的字符串格式（如 "Monday"）。我们将在后面的章节中详细讨论如何进行这种转换。

#### 语法与参数

要使用这个功能，你需要先确保你的 Series 对象是 datetime64[ns] 类型。一旦确认，语法非常简单：

Series.dt.dayofweek

参数：无
返回值：返回一个包含整数值的 Series，数值范围在 0 到 6 之间。

实战示例：从零开始掌握 `dt.dayofweek`

让我们通过一系列实际的例子，从最基础的用法开始，逐步深入到更复杂的场景。

#### 示例 1：基础用法——处理字符串格式的日期

首先，我们来看最常见的情况：我们的数据可能最初是以字符串形式存在的。我们需要先将它们转换为 Pandas 的 datetime 对象，然后才能访问 .dt 访问器。

假设我们有一组记录了特定事件发生时间的字符串列表：

import pandas as pd

# 原始数据：包含日期时间的字符串列表
# 注意：这里模拟了混合格式的字符串
raw_dates = [‘2023-01-01 09:30‘, ‘2023-01-02 12:30‘, ‘2023-01-03 10:30‘,
             ‘2023-01-04 09:25‘, ‘2023-01-05 02:22‘]

# 创建 Series
sr = pd.Series(raw_dates)

# 定义一个更有意义的索引
idx = [‘Event 1‘, ‘Event 2‘, ‘Event 3‘, ‘Event 4‘, ‘Event 5‘]
sr.index = idx

# 关键步骤：将字符串转换为 datetime 类型
# 只有转换为 datetime 类型，我们才能使用 .dt 访问器
sr = pd.to_datetime(sr)

print("转换后的日期时间 Series:")
print(sr)
print("
数据类型:", sr.dtype)

现在，数据已经准备好了。让我们调用 dt.dayofweek 来查看这些事件分别发生在周几：

result = sr.dt.dayofweek

print("
提取的星期几 (0=周一, 6=周日):")
print(result)

通过输出结果，我们可以清晰地看到每个日期对应的整数编号。例如，2023年1月1日是星期日，对应的整数是 6；而1月2日是星期一，对应的整数是 0。

#### 示例 2：生成连续的日期范围

在时间序列分析中，我们经常需要生成一个连续的时间范围作为基准。Pandas 的 pd.date_range 函数非常适合这个任务。让我们创建一个从 2019 年 7 月开始的月度频率序列，并分析其中的星期分布。

import pandas as pd

# 使用 pd.date_range 创建一个 5 个月的日期序列
# 起始时间：2019-7-18 12:12
# 频率：‘M‘ (月末)
date_series = pd.Series(pd.date_range(‘2019-7-18 12:12‘, periods=5, freq=‘M‘))

# 设置自定义索引
idx = [‘Month 1‘, ‘Month 2‘, ‘Month 3‘, ‘Month 4‘, ‘Month 5‘]
date_series.index = idx

print("生成的月末日期序列:")
print(date_series)

接下来，我们提取这些月末日期的星期几：

# 使用 dt.dayofweek 获取星期几
weekdays = date_series.dt.dayofweek

print("
对应日期的星期几编号:")
print(weekdays)

从这个结果中，我们不仅能获取到数字，还能发现一个有趣的现象：使用 INLINECODE367767d9 生成的日期都是每个月的最后一天。通过 INLINECODEb31109a3，我们可以快速分析出某个月份的最后一天是否经常落在周末（5 或 6）。这对于财务结算（通常避免在周末进行）非常有用。

进阶技巧：将数字转换为星期名称

虽然返回整数（0-6）对计算机处理很友好，但在给客户展示报告或绘制图表时，"Monday" 远比 "0" 更直观。我们可以利用 Pandas 的 day_name() 方法来实现这一点，或者手动创建一个映射字典。

#### 方法 A：使用 day_name() (推荐)

这是最简洁、最地道的 Pandas 写法：

# 假设我们继续使用上面的 date_series
weekday_names = date_series.dt.day_name()

print("星期的具体名称:")
print(weekday_names)

#### 方法 B：手动映射

如果你需要自定义显示格式（例如只显示 "Mon" 而不是 "Monday"），你可以创建一个映射表：

# 定义映射字典：将数字映射为简短的星期字符串
week_map = {
    0: ‘周一‘,
    1: ‘周二‘,
    2: ‘周三‘,
    3: ‘周四‘,
    4: ‘周五‘,
    5: ‘周六‘,
    6: ‘周日‘
}

# 使用 map 函数应用映射
# 注意：我们需要先获取 dayofweek 的整数序列，然后进行 map
mapped_names = date_series.dt.dayofweek.map(week_map)

print("映射后的中文星期:")
print(mapped_names)

实际应用场景：商业数据分析

让我们把学到的知识应用到一个更真实的场景中。假设我们是一家零售连锁店的数据分析师，我们有一份 2023 年 10 月的销售记录。我们想知道销售额在一周中的分布情况，看看是不是大家都喜欢周末购物。

import pandas as pd
import numpy as np

# 模拟生成一份销售数据
# 创建一个日期范围，包含 2023年10月1日 到 10月31日 的所有天数
dates = pd.date_range(start=‘2023-10-01‘, end=‘2023-10-31‘, freq=‘D‘)

# 随机生成销售金额 (为了演示，这只是随机数)
np.random.seed(42) # 设置种子以保证结果可复现
sales_amount = np.random.randint(1000, 5000, size=len(dates))

# 创建 DataFrame
df_sales = pd.DataFrame({
    ‘date‘: dates,
    ‘amount‘: sales_amount
})

# 关键分析：提取星期几
# 我们不仅提取数字，还提取名称方便阅读
df_sales[‘weekday_num‘] = df_sales[‘date‘].dt.dayofweek
df_sales[‘weekday_name‘] = df_sales[‘date‘].dt.day_name()

# 查看前几行数据
print("销售数据预览:")
print(df_sales.head(10))

# 计算每周各日的平均销售额
# 这里我们可以按 weekday_num 分组聚合
avg_sales_by_day = df_sales.groupby(‘weekday_name‘)[‘amount‘].mean().sort_values(ascending=False)

print("
按星期几分组的平均销售额:")
print(avg_sales_by_day)

通过上述代码，我们不仅提取了星期几，还结合了 groupby 操作进行了聚合分析。这是数据分析中非常标准且强大的工作流。你可以清晰地看到哪一天的平均销售额最高（可能是周六或周日），从而为营销活动提供数据支持。

2026 前瞻：工程化视角与 AI 辅助开发

随着我们进入 2026 年，数据工程的格局已经发生了深刻的变化。单纯的“写代码”正在被“AI 辅助的工程协作”所取代。在处理像 dt.dayofweek 这样看似简单的功能时，我们也需要引入更现代化的思维方式。

#### 生产级代码：鲁棒性与类型提示

在 2026 年，数据脚本不再是只能跑一次的 Jupyter Notebook，而是需要被集成为自动化流水线的一部分。当我们在 Cursor 或 GitHub Copilot 等 AI IDE 中工作时，我们会更加注重代码的规范性。让我们看看如何编写一个生产级的时间特征提取函数。

import pandas as pd
from typing import Union

# 定义类型别名，提高代码可读性
DateTimeSeries = Union[pd.Series, pd.DatetimeIndex]

def extract_weekday_features(dates: DateTimeSeries, locale: str = ‘en_US‘) -> pd.DataFrame:
    """
    从日期序列中提取星期特征的工程化函数。
    
    参数:
        dates: datetime64 类型的 Series 或 DatetimeIndex
        locale: 区域设置，支持 ‘en_US‘ (默认) 或 ‘zh_CN‘
    
    返回:
        包含 ‘weekday_num‘ 和 ‘weekday_name‘ 的 DataFrame
    """
    # 1. 输入验证：这是在 AI 辅助编程中经常被忽略，但至关重要的步骤
    if not pd.api.types.is_datetime64_any_dtype(dates):
        raise TypeError(f"输入必须是 datetime 类型，当前类型为: {dates.dtype}")

    result = pd.DataFrame()
    
    # 2. 核心逻辑：使用向量化操作
    result[‘weekday_num‘] = dates.dt.dayofweek
    
    # 3. 国际化支持：根据区域设置生成名称
    # 在大型全球化项目中，硬编码 ‘Monday‘ 是不可取的
    if locale == ‘zh_CN‘:
        day_map = {0: ‘周一‘, 1: ‘周二‘, 2: ‘周三‘, 3: ‘周四‘, 4: ‘周五‘, 5: ‘周六‘, 6: ‘周日‘}
        result[‘weekday_name‘] = result[‘weekday_num‘].map(day_map)
    else:
        # 默认使用 Pandas 内置的高性能 day_name()
        result[‘weekday_name‘] = dates.dt.day_name()
        
    return result

# 实际使用示例
dates = pd.date_range(‘2026-05-01‘, periods=5)
features = extract_weekday_features(dates, locale=‘zh_CN‘)
print(features)

在这个例子中，我们不仅使用了 dt.dayofweek，还加入了类型提示和输入验证。这在 2026 年的开发环境中非常重要，因为它能帮助 AI 工具（如 Copilot）更准确地理解我们的意图，提供更智能的代码补全，并减少运行时错误。

#### 处理大规模数据与 Polars 的崛起

虽然 Pandas 依然是数据科学的瑞士军刀，但在处理超大规模数据集（例如数十亿行级别的日志数据）时，内存压力可能会成为瓶颈。在我们的实践中，如果遇到性能瓶颈，我们通常会考虑转向 Polars——这是目前增长最快的数据分析库，使用 Rust 编写，利用多核并行处理。

让我们看看同样的逻辑在 Polars 中是如何实现的，以展现 2026 年的技术多样性：

# 这是一个对比视角，展示我们如何做技术选型
# pip install polars
import polars as pl

df_pl = pl.DataFrame({
    "date": ["2026-01-01", "2026-01-02", "2026-01-03"]
})

# Polars 语法非常简洁且高效
# .str.strptime 用于解析字符串
# .dt.weekday() 获取星期 (注意：Polars 默认周一为1，周日为7，这与 Pandas 略有不同)
result_pl = df_pl.with_columns(
    pl.col("date").str.strptime(pl.Date).dt.weekday().alias("weekday")
)

print(result_pl)

技术决策经验：如果数据量小于 1GB，Pandas 的 dt.dayofweek 完全足够且生态更成熟。但如果数据量达到 TB 级别，或者你需要毫秒级的响应时间，我们强烈建议切换到 Polars。这种根据数据规模选择工具的意识，是资深开发者与入门者的区别所在。

常见错误与最佳实践

在使用 dt.dayofweek 时，新手往往会遇到一些“坑”。让我们来看看如何避免它们。

#### 1. 忘记转换数据类型

最常见的问题是直接对字符串类型的 Series 调用 .dt 属性。

# 错误示范
sr_str = pd.Series([‘2023-01-01‘, ‘2023-01-02‘])
try:
    # 这会报错：AttributeError: Can only use .dt accessor with datetimelike values
    print(sr_str.dt.dayofweek)
except AttributeError as e:
    print(f"捕获到错误: {e}")

# 正确做法
sr_correct = pd.to_datetime(sr_str)
print("正确转换后的结果:", sr_correct.dt.dayofweek.tolist())

#### 2. 处理空值

如果你的时间序列中包含 INLINECODEb8ed68ce (Not a Time，即时间戳格式的空值)，INLINECODE14a64264 也能很好地处理，它会保持 NaN 的状态。但在聚合计算时，你需要决定是忽略这些空值还是填充它们。

# 包含空值的 Series
dates_with_nan = pd.Series([pd.to_datetime(‘2023-01-01‘), pd.NaT, pd.to_datetime(‘2023-01-03‘)])
result = dates_with_nan.dt.dayofweek
print("包含空值的处理结果:")
print(result)
# 结果将是: 0.0, NaN, 2.0

#### 3. 性能优化建议

对于超大规模的数据集（例如数亿行数据），提取星期几的操作非常快，因为它是向量化操作。但是，如果你还需要进行复杂的字符串转换（如自定义格式化），建议尽量使用 INLINECODEee2f215d 访问器提供的内置方法（如 INLINECODE95eb6ad1），而不是使用 Python 的 apply 函数，因为前者通常经过 C 语言层面的优化，速度要快得多。

关键要点与后续步骤

在这篇文章中，我们全面学习了如何使用 Pandas 从时间序列中提取星期几。让我们回顾一下核心要点：

核心属性：Series.dt.dayofweek 是提取星期几的黄金标准，它返回 0（周一）到 6（周日）的整数。
数据类型是关键：在使用 INLINECODE5ed2c72a 访问器之前，务必确保你的 Series 已经通过 INLINECODE858c8aa4 转换为了 datetime64 类型。
可读性：结合 INLINECODE1c64b794 或 INLINECODE34eb7582 方法，可以轻松将数字转换为易读的字符串，提升报告质量。
实战价值：这个功能在零售分析、日志分析、服务器监控等任何具有周期性规律的业务场景中都极具价值。
未来视角：随着 AI 工具的普及，我们更应关注代码的规范性和鲁棒性，同时保持对 Polars 等新兴高性能工具的关注。

现在你已经掌握了这个工具，不妨尝试在自己的数据集上应用一下。你可以尝试结合 INLINECODE0335c2b8 和 INLINECODE29bb0840 画出你的一周数据分布图，看看是否能发现什么有趣的业务规律。继续探索 Pandas 的强大时间序列功能，它能为你打开数据深层次洞察的大门。

投稿给我们	如何建站？
vps是什么？	如何安装宝塔？
如何通过博客赚钱？	便宜wordpress托管方案
免费wordpress主题	这些都是免费方案

豆丁博客

Pandas 实战指南：如何优雅地从日期时间序列中提取星期几

理解 `dt.dayofweek` 的基础

实战示例：从零开始掌握 `dt.dayofweek`

进阶技巧：将数字转换为星期名称

实际应用场景：商业数据分析

2026 前瞻：工程化视角与 AI 辅助开发

常见错误与最佳实践

关键要点与后续步骤

相关文章美国1G带宽/1T流量高速vps $17.99/年

Pandas 实战指南：如何优雅地从日期时间序列中提取星期几

理解 dt.dayofweek 的基础

实战示例：从零开始掌握 dt.dayofweek

进阶技巧：将数字转换为星期名称

实际应用场景：商业数据分析

2026 前瞻：工程化视角与 AI 辅助开发

常见错误与最佳实践

关键要点与后续步骤

相关文章美国1G带宽/1T流量高速vps $17.99/年

理解 `dt.dayofweek` 的基础

实战示例：从零开始掌握 `dt.dayofweek`