网站首页 > 技术文章 正文
技术背景
在Python编程中,经常需要列出目录下的所有文件,根据不同的需求,可能只需要列出当前目录下的文件,也可能需要递归列出子目录下的所有文件。Python提供了多种方法来实现这一功能,下面将详细介绍这些方法。
实现步骤
1. os.listdir()方法
os.listdir() 可以返回目录下的所有内容,包括文件和目录。使用 os.path.isfile() 可以过滤出其中的文件。
from os import listdir
from os.path import isfile, join
mypath = '.' # 当前目录
onlyfiles = [f for f in listdir(mypath) if isfile(join(mypath, f))]
2. os.walk()方法
os.walk() 可以递归遍历目录树,对于每个目录,它会返回一个三元组 (dirpath, dirnames, filenames)。
from os import walk
mypath = '.'
f = []
for (dirpath, dirnames, filenames) in walk(mypath):
f.extend(filenames)
break # 只获取顶层目录的文件
或者使用更简洁的写法:
from os import walk
filenames = next(walk(mypath), (None, None, []))[2] # [] if no file
3. glob模块
glob 模块可以进行模式匹配和扩展。
import glob
# 列出当前目录下所有文件和目录
print(glob.glob("*"))
# 列出当前目录下所有 .txt 文件
print(glob.glob("*.txt"))
4. pathlib模块(Python 3.4+)
pathlib 提供了面向对象的文件系统路径操作方式。
import pathlib
root_dir = "root_dir"
root_dir_instance = pathlib.Path(root_dir)
# 列出根目录下所有直接子项的名称
print([item.name for item in root_dir_instance.glob("*")])
# 列出根目录下所有文件的路径
print([os.path.join(item.parent.name, item.name) for item in root_dir_instance.glob("*") if not item.is_dir()])
5. os.scandir()方法(Python 3.5+)
os.scandir() 返回一个迭代器,包含目录中的条目。
import os
root_dir = os.path.join(".", "root_dir")
scandir_iterator = os.scandir(root_dir)
# 列出根目录下所有条目路径
print([item.path for item in scandir_iterator])
核心代码
使用 os.listdir()过滤文件
from os import listdir
from os.path import isfile, join
mypath = '.'
onlyfiles = [f for f in listdir(mypath) if isfile(join(mypath, f))]
print(onlyfiles)
使用 os.walk()递归获取文件
from os import walk
mypath = '.'
file_paths = []
for root, dirs, files in walk(mypath):
for file in files:
file_paths.append(os.path.join(root, file))
print(file_paths)
使用 glob模块匹配文件
import glob
# 列出当前目录下所有 .txt 文件
txt_files = glob.glob("*.txt")
print(txt_files)
使用 pathlib模块获取文件
import pathlib
folder = '.'
file_list = [f for f in pathlib.Path(folder).glob('*') if f.is_file()]
print(file_list)
最佳实践
- 根据需求选择合适的方法:如果只需要列出当前目录下的文件,os.listdir() 或 os.scandir() 是不错的选择;如果需要递归列出子目录下的文件,os.walk() 或 glob 模块更合适;如果需要面向对象的路径操作,pathlib 模块是首选。
- 考虑性能:对于大型目录树,os.walk() 和 glob.iglob() 可能更高效,因为它们使用了生成器。
- 错误处理:在实际应用中,应该添加适当的错误处理代码,以确保程序的健壮性。
常见问题
1. 如何处理递归深度问题?
在使用递归方法(如 os.walk())时,如果目录树的深度过大,可能会导致栈溢出。可以考虑使用迭代方法或调整递归深度限制。
2. 如何处理路径分隔符问题?
不同操作系统使用不同的路径分隔符(Windows 使用 \,Unix/Linux 使用 /)。可以使用 os.path.join() 或 pathlib 模块来处理路径,以确保代码的跨平台兼容性。
3. 如何过滤特定类型的文件?
可以使用 os.path.splitext() 或 fnmatch 模块来过滤特定类型的文件。例如,过滤出所有 .txt 文件:
import os
import fnmatch
mypath = '.'
txt_files = [f for f in os.listdir(mypath) if fnmatch.fnmatch(f, '*.txt')]
print(txt_files)
- 上一篇: 用python帮别人写了个文字识别程序
- 下一篇: 一日一技:使用Python读取Excel文件
猜你喜欢
- 2025-05-23 如何在Python中保存文件?如何读取文件?示例代码
- 2025-05-23 python读取Excel表格
- 2025-05-23 OpenCV-Python教程:从视频文件、相机获取图像、写视频文件
- 2025-05-23 Dify Sandbox实现文件路径获取与Excel数据处理
- 2025-05-23 python中文件读写操作最佳实践——使用 os.path 进行路径操作
- 2025-05-23 Python 开发工程师必会的 5 个文件操作库
- 2025-05-23 开眼界!Python遍历文件可以这样做
- 2025-05-23 白帽黑客如何通过dirsearch脚本工具扫描和收集网站敏感文件
- 2025-05-23 使用python获取选择目录及子目录下所有文件
- 2025-05-23 失业程序员复习python笔记——excel读写处理
- 05-25Python 3.14 t-string 要来了,它与 f-string 有何不同?
- 05-25Python基础元素语法总结
- 05-25Python中的变量是什么东西?
- 05-25新手常见的python报错及解决方案
- 05-2511-Python变量
- 05-2510个每个人都是需要知道Python问题
- 05-25Python编程:轻松掌握函数定义、类型及其参数传递方式
- 05-25Python基础语法
- 257℃Python短文,Python中的嵌套条件语句(六)
- 257℃python笔记:for循环嵌套。end=""的作用,图形打印
- 256℃PythonNet:实现Python与.Net代码相互调用!
- 251℃Python操作Sqlserver数据库(多库同时异步执行:增删改查)
- 251℃Python实现字符串小写转大写并写入文件
- 106℃原来2025是完美的平方年,一起探索六种平方的算吧
- 90℃Python 和 JavaScript 终于联姻了!PythonMonkey 要火?
- 81℃Ollama v0.4.5-v0.4.7 更新集合:Ollama Python 库改进、新模型支持
- 最近发表
- 标签列表
-
- python中类 (31)
- python 迭代 (34)
- python 小写 (35)
- python怎么输出 (33)
- python 日志 (35)
- python语音 (31)
- python 工程师 (34)
- python3 安装 (31)
- python音乐 (31)
- 安卓 python (32)
- python 小游戏 (32)
- python 安卓 (31)
- python聚类 (34)
- python向量 (31)
- python大全 (31)
- python次方 (33)
- python桌面 (32)
- python总结 (34)
- python浏览器 (32)
- python 请求 (32)
- python 前端 (32)
- python验证码 (33)
- python 题目 (32)
- python 文件写 (33)
- python中的用法 (32)