网站首页 > 技术文章 正文
《大数据和人工智能交流》头条号向广大初学者新增C 、Java 、Python 、Scala、javascript 等目前流行的计算机、大数据编程语言,希望大家以后关注本头条号更多的内容。
使用python编写3个线程同时采集商品“新品上架”的信息:
一、页面参考信息
页面部分代码如下:
- 大牌狂降价,三折直送
- 大学老师开网店
- 黑眼圈推荐,美白不停
- 瘦身狂潮风,修形之选
- 大牌狂降价,三折直送
- 大学老师开网店
- 黑眼圈推荐,美白不停
- 瘦身狂潮风,修形之选
- 大牌狂降价,三折直送
- 大学要求老师开网店
- 黑眼圈推荐,美白不停
- 瘦身狂潮风,修形之选
- 大牌狂降价,三折直送
- 大学老师开网店
- 黑眼圈推荐,美白不停
- 瘦身狂潮风,修形之选
- 黑眼圈推荐,美白不停
- 瘦身狂潮风,修形之选
- 大牌狂降价,三折直送
二、参考代码
from bs4 import BeautifulSoup
import threading # 导入线程库
import time
# 打开文件
with open('index.html', encoding="GB2312") as data:
content = data.read()
soup = BeautifulSoup(content, 'html.parser')
# 得到数据
datas = soup.find_all('div', attrs={'id': 'dome1'})
labels = datas[0].find_all('dl')
# 爬取数据
def print_label(threadName, labels):
for label in labels:
time.sleep(i // 10)
info = label.find_all('dd')
print("线程%d获取到数据:=====%s\n"%(threadName,info[0].get_text()))
threads = []
# 创建线程对象
for i in range(3):
split = int(len(labels) / 3)
if i == 2:
# 创建新线程并添加到线程列表
threads.append(threading.Thread(target=print_label, args=(i, labels[split * i:])))
else:
threads.append(threading.Thread(target=print_label, args=(i, labels[split * i:split * (i + 1)])))
# 运行线程
for th in threads:
th.start()
# 等待线程退出
for th in threads:
th.join()
print("finished")
猜你喜欢
- 2025-03-11 Python开发的自动上传采集工具,轻松采集网站数据
- 2025-03-11 详细介绍一下Python中如何使用来创建爬虫?
- 2025-03-11 一篇文章教会你使用Python定时抓取微博评论
- 2025-03-11 Python性能监控实战,掌握性能指标采集
- 2025-03-11 Scrapy爬虫框架 批量抓取数据轻轻松松啦~
- 2025-03-11 自动化测试实战篇:基于Python实践性能指标结果自动采集工具
- 2025-03-11 从0教你用Python写网络爬虫,内容详细代码清晰,适合入门学习
- 2025-03-11 突破某易云的JS逆向,利用Python采集整站数据
- 2025-03-11 我背着女朋友,用 Python 偷偷抓取了她的行踪
- 2025-03-11 免Python也能网页抓取:用AI自动完成 HTML 解析和数据提取
- 265℃Python短文,Python中的嵌套条件语句(六)
- 264℃python笔记:for循环嵌套。end=""的作用,图形打印
- 263℃PythonNet:实现Python与.Net代码相互调用!
- 259℃Python实现字符串小写转大写并写入文件
- 257℃Python操作Sqlserver数据库(多库同时异步执行:增删改查)
- 117℃原来2025是完美的平方年,一起探索六种平方的算吧
- 98℃Python 和 JavaScript 终于联姻了!PythonMonkey 要火?
- 90℃Ollama v0.4.5-v0.4.7 更新集合:Ollama Python 库改进、新模型支持
- 最近发表
- 标签列表
-
- python中类 (31)
- python 迭代 (34)
- python 小写 (35)
- python怎么输出 (33)
- python 日志 (35)
- python语音 (31)
- python 工程师 (34)
- python3 安装 (31)
- python音乐 (31)
- 安卓 python (32)
- python 小游戏 (32)
- python 安卓 (31)
- python聚类 (34)
- python向量 (31)
- python大全 (31)
- python次方 (33)
- python桌面 (32)
- python总结 (34)
- python浏览器 (32)
- python 请求 (32)
- python 前端 (32)
- python验证码 (33)
- python 题目 (32)
- python 文件写 (33)
- python中的用法 (32)