程序员文章、书籍推荐和程序员创业信息与资源分享平台

网站首页 > 技术文章 正文

Python洗涤百度搜索结果

hfteth 2025-01-13 14:14:59 技术文章 17 ℃

主要思路

利用Python处理百度搜索关键字后返回的页面,提取其中的有效信息。

有效信息包括:

剔除广告等无用链接后的有用链接以及这些有用链接的标题信息。

开发工具

Python版本:3.5.4

相关模块:

requests模块、bs4模块、win_unicode_console模块、PyQt5模块以及一些Python自带的模块。

环境搭建

安装Python并添加到环境变量,pip安装需要的相关模块即可。

使用方式

(1)直接运行

功能:

在cmd窗口运行BaiduSearch_Spider.py文件后,根据提示输入相关信息后将得到的有效信息保存到results.txt文件中。

若需其他功能请自行修改源代码。

运行示例如下图所示:

结果:

(2)作为模块导入

使用示例如下图所示:

运行以及结果图:

说明与简单实例

返回的数据格式为:

image

简单实例:

功能:

(1)在cmd窗口中运行并展示获得的有效信息;

(2)根据有效信息选择想要了解的链接后将该链接网站在PyQt制作的简易Demo中显示。

结果图:

image

有小伙伴私信我,要Python的学习资料,我连夜整理了一些有深度的Python教程和参考资料,从入门到高级的都有,文件已经打包好了,正在学习Python的同学可以免费下载学习,有兴趣的可以下载来看一下。资料是我辛苦整理的可不能轻易得到哟。点击我的头像,关注后私信回复“资料”即可下载。首先把代码撸起来!首先把代码撸起来!首先把代码撸起来!重要的事说三遍,哈哈。“编程是门手艺活”。什么意思?得练啊。

最近发表
标签列表