网站首页 > 技术文章 正文
大家好,我是皮皮。
一、前言
前几天在Python钻石交流群【Hxy任我肥】问了一个Python自动化办公的问题,提问截图如下:
想要的效果是下图这样的:
准确来说,这个都不算是问题了,而是一个实实在在的需求。
二、实现过程
这里【Jason】给了一个可行的思路,如下:
后来【瑜亮老师】给了一个具体的代码,如下所示:
import re
from docx import Document
import pandas as pd
document = Document("判断(括号处理)(1).docx")
all_paragraphs = document.paragraphs
data = [paragraph.text for paragraph in all_paragraphs if '√' in paragraph.text or '×' in paragraph.text]
data = ''.join(data)
res = re.findall('[√×]', data, re.S)
res = [f'{k + 1}.{v}' for k, v in enumerate(res)]
df = pd.DataFrame(res)
df.to_excel('test9-13.xlsx', index=False, header=None)
真的太强了!
代码运行之后可以得到预期的结果,如下图所示:
后来【狂吃山楂片】基于此代码,来了个简易版的,代码如下所示:
import re
from docx import Document
import pandas as pd
document = Document(r"判断(括号处理)(1).docx")
text = document.part.blob.decode('utf-8')
text = re.sub(r'<.*?>', '', text)
text = re.sub(r'\.\s+', r'.', text)
df = pd.DataFrame(re.findall(r'\d+\.[√×]', text))
df.to_excel('result.xlsx', header=None, index=False)
这技术真是到家了,出神入化的。
代码运行之后,也完全可以实现这个需求。
后来【瑜亮老师】还给了一个代码,也非常赞,如下所示:
data = [paragraph.text for paragraph in all_paragraphs if '√' in paragraph.text or '×' in paragraph.text]
# 合并为一个长字符串,然后替换删除所有的空格
data = ''.join(data).replace(' ', '')
# 使用re正则表达式提取出所有含有题号的答案
res = re.findall(r'\d+\.[√×]', data, re.S)
df = pd.DataFrame(res)
df.to_excel('test9-13.xlsx', index=False, header=None)
真让人叹为观止!把多余的空格都替换删除,可以防止答案中含有空格而导致不能被正则r'\d+\.[√×]'匹配到,这样就一步到位了。不用再用列表推导式构造答案。
你以为这就完事了?
后来【甯同学】使用openpyxl库也搞定了,代码如下图所示:
import re
import docx
import openpyxl
def str_work(string:str):
return [*filter(None,re.split('\.',re.sub('\d+','',string.replace(' ', '').replace('\n', ''))))]
wb = openpyxl.Workbook()
ws = wb.active
ws.append(['题目','答案'])
doc = docx.Document(r'C:\Users\Administrator\Desktop\判断(括号处理).docx')
doc_text = '\n'.join(( i.text for i in doc.paragraphs[3:]))
doc_list = doc_text.split('\n一、判断题')
title_row = [i.strip() for i in doc_list[0].split('\n') if i.strip().split('、')!=['']]
answer_row = [i for i in str_work(doc_list[1])]
for i in zip(title_row,answer_row):
ws.append(list(i))
wb.save('1.xlsx')
运行之后得到的结果如下图所示:
三、总结
大家好,我是皮皮。这篇文章主要盘点了一个Python自动化办公的问题,文中针对该问题,给出了具体的解析和代码实现,帮助粉丝顺利解决了问题。
最后感谢粉丝【Hxy任我肥】提问,感谢【Jason】、【瑜亮老师】、【狂吃山楂片】、【甯同学】给出的思路和代码解析,感谢【dcpeng】、【产后修复】、【此类生物】、【余克富】等人参与学习交流。
猜你喜欢
- 2025-07-10 Python 使用 JsonPath 完成接口自动化测试中参数关联和数据验证
- 2025-07-10 python自动化测试学习day01(python自动化测试学习day0121)
- 2025-07-10 Python、Selenium 和 Allure 进行 UI 自动化测试的简单示例脚本
- 2025-07-10 一文讲清怎么利用Python实现企业数字化设备自动化巡检系统
- 2025-07-10 Playwright+Python3工具自动化测试实战
- 2025-07-10 全面学习Selenium和Python的Web自动化测试项目实战!
- 2025-07-10 python web自动化测试 入门学习(三)
- 2025-07-10 Python 实现 dubbo 协议接口自动化测试
- 2025-07-10 从代码小白到自动化大师:Python 编程实战
- 2025-07-10 Python玩转机器学习自动化调参:从“人肉调参”到“智造调参”
- 277℃Python短文,Python中的嵌套条件语句(六)
- 276℃python笔记:for循环嵌套。end=""的作用,图形打印
- 273℃PythonNet:实现Python与.Net代码相互调用!
- 268℃Python实现字符串小写转大写并写入文件
- 267℃Python操作Sqlserver数据库(多库同时异步执行:增删改查)
- 126℃原来2025是完美的平方年,一起探索六种平方的算吧
- 110℃Ollama v0.4.5-v0.4.7 更新集合:Ollama Python 库改进、新模型支持
- 107℃Python 和 JavaScript 终于联姻了!PythonMonkey 要火?
- 最近发表
-
- 假期苦短,我用Python!这有个自动回复拜年信息的小程序
- 第4天|16天搞定Python数据分析,图表,靓靓靓
- 60带源代码的Python项目之 08 使用 Python 生成 QR 码
- 用python3 实现生成二维码代码示例
- python批量生成二维码图片(python如何生成二维码)
- 使用python生成二维码(python生成二维码界面)
- Python制作二维码(python制作二维码小作业)
- Python 生成条形码、二维码 (Code 128、EAN-13、QR code等)
- python如何实现二维码的生成和识别
- Python 使用 JsonPath 完成接口自动化测试中参数关联和数据验证
- 标签列表
-
- python中类 (31)
- python 迭代 (34)
- python 小写 (35)
- python怎么输出 (33)
- python 日志 (35)
- python语音 (31)
- python 工程师 (34)
- python3 安装 (31)
- python音乐 (31)
- 安卓 python (32)
- python 小游戏 (32)
- python 安卓 (31)
- python聚类 (34)
- python向量 (31)
- python大全 (31)
- python次方 (33)
- python桌面 (32)
- python总结 (34)
- python浏览器 (32)
- python 请求 (32)
- python 前端 (32)
- python验证码 (33)
- python 题目 (32)
- python 文件写 (33)
- python中的用法 (32)