深入掌握 Python fnmatch 模块：Unix 风格的文件名匹配艺术

2026-02-15 21:17:36 0条评论 52次阅读 0人点赞

在日常的开发工作中，你是否经常需要处理大量的文件，并希望有一种简单的方式来筛选它们？比如，"找出所有日志文件"或者"删除所有临时图片"。虽然 Python 的 glob 模块很强大，但有时我们只需要对文件名进行单纯的字符串匹配，而不涉及磁盘 I/O 操作。这时，Python 标准库中的 fnmatch 模块就成了我们的得力助手。

在这篇文章中，我们将深入探讨 fnmatch 模块。它提供了一种简洁而高效的方式，让我们能够使用 Unix shell 风格的通配符来匹配文件名。无论你是在编写文件清理脚本，还是在构建复杂的文件过滤系统，掌握这个模块都将极大地提升你的工作效率。让我们一起探索它的内部机制、核心函数以及在实际项目中的最佳实践。

1 什么是 fnmatch？为什么我们需要它？
2 核心函数详解与实战
3 常见问题与最佳实践
4 总结与后续步骤

什么是 fnmatch？为什么我们需要它？

简单来说，fnmatch 是 Python 专门用于处理文件名模式匹配的模块。它将复杂的正则表达式语法简化为我们熟悉的 Shell 通配符（如 INLINECODE489cf598 或 INLINECODEfbfd8d5b）。这使得代码对于非程序员来说也更易读，同时也让我们在处理文件路径时更加得心应手。

核心通配符语法

在使用 fnmatch 之前，我们需要先了解它支持的几种特殊字符（元字符）。这些字符直接借鉴了 Unix Shell 的风格，非常直观：

INLINECODE1249957d (星号)：匹配所有内容。它代表任意数量的字符（包括零个字符）。例如，INLINECODEc2dc2ca6 可以匹配 INLINECODE917b7226、INLINECODE4999778a，甚至仅仅是 .txt。
INLINECODEe7082f95 (问号)：匹配任意单个字符。例如，INLINECODE3181ed73 可以匹配 INLINECODEdf037c57 或 INLINECODEd2e47745，但不会匹配 file10.py。
INLINECODEe5496029 (字符集)：匹配 seq 中的任意一个字符。例如，INLINECODE6ce34369 可以匹配 INLINECODE342983ce、INLINECODEf61cba8f 或 INLINECODE2b69e8fd。它也支持范围，如 INLINECODEa5ced45c 匹配所有小写字母。
INLINECODE13ee18d6 (反向字符集)：匹配不在 seq 中的任意一个字符。例如，INLINECODE21c5726c 可以匹配 INLINECODEeafa1d4a，但不会匹配 INLINECODEf07103ab。

字面量匹配的技巧

如果你想匹配上述特殊字符本身（例如，你的文件名里真的有一个问号），你需要用方括号将它们括起来。例如，模式 INLINECODEd20ac338 将只匹配字符 INLINECODEe94e1f69，而不是把它当作通配符使用。

> 注意：关于大小写敏感性。fnmatch 的默认行为取决于底层操作系统。在 Windows 上，文件名匹配通常是不区分大小写的（因为 Windows 文件系统不区分大小写），而在 Linux/macOS 上则是区分大小写的。我们在编写跨平台脚本时，必须牢记这一点。

—

核心函数详解与实战

fnmatch 模块主要提供了四个函数。让我们通过实际的代码示例，逐一看看它们是如何工作的。

1. fnmatch.fnmatch(filename, pattern) — 基础匹配

这是最常用的函数。它接受两个参数：文件名字符串和模式字符串。如果匹配成功，返回 INLINECODEb63f02b1，否则返回 INLINECODEd1c5e3e9。

工作原理：

函数会检查操作系统是否区分大小写。如果系统不区分大小写（如 Windows），它会自动将两个参数转换为小写（或大写）后再进行比较。

实战示例：

假设我们正在编写一个脚本，用于扫描当前目录，找出所有以 INLINECODE0a8d5269 开头并以 INLINECODE511c1bfb 结尾的文件（就像我们在整理文档时一样）。

import fnmatch
import os

# 定义我们的匹配模式
pattern = ‘fnmatch_*.py‘
print(f‘正在查找匹配模式: {pattern} 
‘)

# 获取当前目录下的所有文件
files = os.listdir(‘.‘)

# 遍历并打印匹配结果
for name in files:
    # fnmatch 返回布尔值，我们可以直接用于判断
    if fnmatch.fnmatch(name, pattern):
        print(f‘✅ 匹配成功: {name}‘)
    else:
        # 为了演示，这里也打印不匹配的情况，实际使用中可省略
        pass

在这个例子中，INLINECODE075a5264 模式告诉 Python："查找以 ‘fnmatch‘ 开头，中间有任意字符，以 ‘.py‘ 结尾的字符串"。这种方式比使用复杂的正则表达式 ^fnmatch_.*\.py$ 要简洁得多。

2. fnmatch.fnmatchcase(filename, pattern) — 强制区分大小写

有时，我们需要严格的控制权，不希望操作系统环境干扰我们的匹配逻辑。这时，fnmatchcase() 就派上用场了。无论你的文件系统是什么类型，它都会强制进行区分大小写的匹配。

应用场景：

想象你正在编写一个代码审计工具，需要严格检查变量名的命名规范（例如，类名必须大写），或者你正在处理来自 Linux 服务器的日志文件，但你的脚本运行在 Windows 机器上。你需要确保 INLINECODEb17dda66 和 INLINECODE3da963c8 被视为不同的文件。

import fnmatch
import os

# 即使在 Windows 上，这个模式也严格要求大写后缀
pattern = ‘FNMATCH_*.PY‘
print(f‘严格模式匹配: {pattern} 
‘)

files = os.listdir(‘.‘)

for name in files:
    # 使用 fnmatchcase，大小写必须完全一致
    if fnmatch.fnmatchcase(name, pattern):
        print(f‘✅ 严格匹配: {name}‘)
    else:
        # 演示哪些文件因为大小写不匹配而被忽略
        # 例如 ‘fnmatch_filter.py‘ 会被认为是 False
        print(f‘❌ 忽略 (大小写不符): {name}‘)

在这个脚本中，只有像 INLINECODEff0fdfc6 这样完全大写的文件名才会被匹配。INLINECODEd24af16f（全小写）将会返回 INLINECODEf73b9ed3，这与 INLINECODEefe65ae9 在默认情况下的行为可能截然不同。

3. fnmatch.filter(names, pattern) — 批量过滤

如果你有一个包含大量文件名的列表，想要从中筛选出符合特定条件的子集，使用列表推导式配合 INLINECODEa9690eca 当然可以，但 INLINECODE52d4514c 函数提供了更加方便和高效的原生实现。

实用见解：

这个函数非常适合用于处理文件系统扫描的结果，或者过滤从数据库/API获取的文件名列表。它返回一个新的列表，仅包含匹配成功的项。

实战示例：

我们要从一堆文件中快速提取所有 Python 脚本。

import fnmatch
import os

# 模拟一个包含各种杂乱文件的列表
files = [
    ‘report.pdf‘, ‘data.csv‘, ‘script.py‘, ‘archive.zip‘,
    ‘setup.py‘, ‘image.png‘, ‘notes.txt‘, ‘test_script.py‘
]

pattern = ‘*.py‘

# 使用 filter 函数一次性获取所有匹配项
matched_files = fnmatch.filter(files, pattern)

print(f‘所有文件: {files}‘)
print(f‘筛选后的 Python 脚本: {matched_files}‘)

这段代码等价于 INLINECODE757ac5f4，但 INLINECODE925c1034 函数通常在内部实现上更为紧凑，且语义更清晰，让我们的代码看起来更加专业。

4. fnmatch.translate(pattern) — 转换为正则表达式

这是一个非常有意思的高级功能。它将 shell 风格的模式转换为 Python 正则表达式（re 模块能理解的格式）。这揭示了 fnmatch 的工作原理：它本质上就是一个正则表达式的包装器。

为什么我们需要它？

调试：你可以看看通配符转换成正则后长什么样，有助于理解匹配逻辑。
复用：如果你需要在一个巨大的文本块（而不是文件名列表）中查找符合某种模式的字符串，你可以利用这个转换后的正则配合 re 模块进行更复杂的搜索。

代码示例：

import fnmatch
import re

# 将简单的 shell 模式转换为正则
shell_pattern = ‘*.txt‘
regex_pattern = fnmatch.translate(shell_pattern)

print(f‘Shell 模式: {shell_pattern}‘)
print(f‘转换后的 Regex: {regex_pattern}‘)

# 编译生成的正则表达式
# 注意：translate 返回的字符串通常包含 (?s:...) 等标志
re_obj = re.compile(regex_pattern)

# 测试匹配
print(f‘
匹配 \‘test.txt\‘: {bool(re_obj.match(\‘test.txt\‘))}‘)
print(f‘匹配 \‘test.csv\‘: {bool(re_obj.match(\‘test.csv\‘))}‘)

当你运行这段代码时，你会发现 INLINECODEca8f9699 被转换成了类似 INLINECODEa6bcc0a0 的字符串。这意味着：INLINECODE58ab1f30 匹配任意字符（INLINECODE2de8f934 使 INLINECODE193a2f9a 也匹配换行符），INLINECODE97029de9 匹配字面量，\Z 匹配字符串结尾。理解这一点，你就能完全掌控匹配的边界行为。

常见问题与最佳实践

在实际开发中，仅仅知道 API 是不够的。我们需要了解一些潜在的问题和解决技巧。

1. 常见错误：大小写陷阱

问题：你在 Linux 上写了一个脚本来匹配 INLINECODE1293adc4，使用了模式 INLINECODE21cb6142。在 Linux 上它工作良好，但当你把脚本交给使用 Windows 的同事时，他发现脚本把 Data.CSV 也匹配上了（因为他想排除大写文件），或者反过来，脚本无法匹配到某些文件。
解决方案：

如果你的脚本需要跨平台运行，并且匹配逻辑必须严格统一，始终使用 fnmatchcase()。不要依赖操作系统的默认设置。
在代码文档中明确指出你的模式是区分大小写还是不区分大小写。

2. 性能优化建议

fnmatch 是纯 Python 实现的，虽然对于大多数文件操作来说足够快，但在处理数百万个文件名时，可能会有瓶颈。

使用 INLINECODE00764565 代替循环：INLINECODE2082f7d4 通常比手写 for 循环调用 fnmatch() 要快一些，因为它的循环是在 C 层面或更优化的 Python 层面处理的。
正则表达式预处理：如果你需要反复使用同一个复杂的通配符模式，使用 INLINECODEa83e2926 一次，然后用 INLINECODEba14c573 编译它，之后直接使用正则对象的 match() 方法。这在处理超大规模数据集时，性能提升会非常明显。

3. `*` 的贪婪性

记住，INLINECODE9f2f27ac 是贪婪的。模式 INLINECODEce8a4159 会匹配 INLINECODE81c609ae。如果你只想匹配最后一层扩展名，或者更复杂的路径结构，你可能需要结合 INLINECODE42ac4f7b 模块先处理路径，或者使用更精确的正则表达式。

总结与后续步骤

通过这篇文章，我们从零开始掌握了 fnmatch 模块的使用。我们了解到：

基础匹配：使用 fnmatch() 进行简单的文件名过滤。
严格匹配：使用 fnmatchcase() 确保跨平台的一致性。
批量处理：使用 filter() 让代码更简洁高效。
底层原理：使用 translate() 理解通配符与正则的关系。

你的下一步行动计划：

重构代码：回到你当前的项目中，看看是否有手动拼接字符串来检查文件名的代码（例如 INLINECODE68290f01），尝试用 INLINECODEbb67e04c 替换它们，使代码更具可扩展性。
编写脚本：编写一个名为 clean_dir.py 的小工具，它能接受命令行参数（如通配符模式），并删除当前目录下匹配该模式的文件。这将是一个很好的练习。
探索 Glob：既然你已经掌握了 INLINECODEad1b41b4，下一步可以去学习 INLINECODE4acc75f7 和 INLINECODE62a66827 模块，它们是在文件系统中直接查找文件的终极工具，而且底层也大量使用了 INLINECODEdc117f40 的逻辑。

希望这篇文章能帮助你更加自信地处理 Python 中的文件名匹配问题。编程愉快！

投稿给我们	如何建站？
vps是什么？	如何安装宝塔？
如何通过博客赚钱？	便宜wordpress托管方案
免费wordpress主题	这些都是免费方案

豆丁博客

深入掌握 Python fnmatch 模块：Unix 风格的文件名匹配艺术

什么是 fnmatch？为什么我们需要它？

核心通配符语法

字面量匹配的技巧

核心函数详解与实战

1. fnmatch.fnmatch(filename, pattern) — 基础匹配

2. fnmatch.fnmatchcase(filename, pattern) — 强制区分大小写

3. fnmatch.filter(names, pattern) — 批量过滤

4. fnmatch.translate(pattern) — 转换为正则表达式

常见问题与最佳实践

1. 常见错误：大小写陷阱

2. 性能优化建议

3. `*` 的贪婪性

总结与后续步骤

相关文章美国1G带宽/1T流量高速vps $17.99/年

深入掌握 Python fnmatch 模块：Unix 风格的文件名匹配艺术

什么是 fnmatch？为什么我们需要它？

核心通配符语法

字面量匹配的技巧

核心函数详解与实战

1. fnmatch.fnmatch(filename, pattern) — 基础匹配

2. fnmatch.fnmatchcase(filename, pattern) — 强制区分大小写

3. fnmatch.filter(names, pattern) — 批量过滤

4. fnmatch.translate(pattern) — 转换为正则表达式

常见问题与最佳实践

1. 常见错误：大小写陷阱

2. 性能优化建议

3. * 的贪婪性

总结与后续步骤

相关文章美国1G带宽/1T流量高速vps $17.99/年

3. `*` 的贪婪性