网站首页 > 技术文章 正文
在“科技强审,科技赋能”驱动下,大数据审计不再局限于某一类单一数据的分析,而是从相互关联的多类数据中挖掘到可用信息。Python作为一种简单、易学、免费、开源的高级编程语言,拥有强大的第三方类库,具有可扩展性、可嵌入性、跨平台性等特点优势,广泛应用于数据分析与挖掘、网络信息获取等领域,为大数据时代创新审计思路,拓宽审计方法提供了技术可能性。
一是Python中jieba库的应用。会议纪要是反映领导干部在执行“三重一大”具体工作的重要表现,而以往通过人工核对的方法,从大量的会议资料中寻找线索,对于审计人员的精力耗费很大,同时效率也不高,且得到审计证据不够充分。使用Python中的jieba库,将会议纪要中的内容智能拆分成若干词组;加入到字典中,遍历查看所有词组出现的频次和长度情况;利用词频数据直接算出不同会议纪要中相似词语出现的频次,进而对整体全局数据进行分析,得出重大精神落实情况。
二是Python中pandas库的应用。在大数据环境下,被审计单位往往信息化程度高,数据繁冗复杂,审计时只能抽取一部分进行审计,这种审计方式很难对被审计单位的整体进行准确全面的审计,审计结论可靠性也很低。使用Python语言的pandas模块可以将相关数据信息从Csv、Excel、Txt等多种格式文件中读出,存放在 Data Frame中,并将原始数据进行简单的清洗处理,删除不需要的数据,将原始数据简单整合,得到我们需要的数据。同时,通过Matplotlib数据分析可视化将数据绘制为可以分析观察的图表和图像,使得数据之间的关系更加清晰,也可以发现异常数据,从而实现审计全覆盖,为审计决策提供支持。
三是Python中爬虫技术的应用。在大数据审计环境中,审计电子数据在审计过程中处于“核心位置”,其完整性、一致性、有效性是大数据审计分析的基础,是发现审计问题与线索的关键。
但是在传统的审计方法中,审计人员通常只能获取被审计单位提供的数据,而这些数据可能不完整或者存在被篡改的风险。而通过分析查看网页的 URL、请求方式、状态码和网站地址代理名称等特定信息,了解网页的构成,编写Python数据采集脚本,实现网络爬虫抓取网页信息,采集来自互联网的各种数据,可以更加全面地了解被审计单位的情况,满足审计数据分析的需求。
大数据的运用给审计系统带来了前所未有的机遇与挑战,要坚持科技强审、数据先行的理念,向信息化要效率,向大数据要资源。充分掌握大数据分析方法,发挥大数据的“整合作用”,实施数据标准化处理,夯实审计工作基础;发挥大数据的“筛子作用”,从多维度挖掘事物之间的隐蔽联系,强化审计精准度;发挥大数据的“引擎作用”,收集、分析、比对各类信息数据,提升审计工作效率,努力践行“新时代审计人”的要求。(吕佳)
- 上一篇: Dask库一个神奇处理大数据在python的库
- 下一篇: 别说你会用Pandas
猜你喜欢
- 2024-12-19 如何使用Python连接MySQL数据库?
- 2024-12-19 pandas中基于范围条件进行表连接
- 2024-12-19 Python里面的self,是谁啊?
- 2024-12-19 Vaex:秒开大数据、比pandas更快更好的Python库
- 2024-12-19 别说你会用Pandas
- 2024-12-19 Dask库一个神奇处理大数据在python的库
- 05-25Python 3.14 t-string 要来了,它与 f-string 有何不同?
- 05-25Python基础元素语法总结
- 05-25Python中的变量是什么东西?
- 05-25新手常见的python报错及解决方案
- 05-2511-Python变量
- 05-2510个每个人都是需要知道Python问题
- 05-25Python编程:轻松掌握函数定义、类型及其参数传递方式
- 05-25Python基础语法
- 257℃Python短文,Python中的嵌套条件语句(六)
- 257℃python笔记:for循环嵌套。end=""的作用,图形打印
- 256℃PythonNet:实现Python与.Net代码相互调用!
- 251℃Python操作Sqlserver数据库(多库同时异步执行:增删改查)
- 251℃Python实现字符串小写转大写并写入文件
- 106℃原来2025是完美的平方年,一起探索六种平方的算吧
- 90℃Python 和 JavaScript 终于联姻了!PythonMonkey 要火?
- 81℃Ollama v0.4.5-v0.4.7 更新集合:Ollama Python 库改进、新模型支持
- 最近发表
- 标签列表
-
- python中类 (31)
- python 迭代 (34)
- python 小写 (35)
- python怎么输出 (33)
- python 日志 (35)
- python语音 (31)
- python 工程师 (34)
- python3 安装 (31)
- python音乐 (31)
- 安卓 python (32)
- python 小游戏 (32)
- python 安卓 (31)
- python聚类 (34)
- python向量 (31)
- python大全 (31)
- python次方 (33)
- python桌面 (32)
- python总结 (34)
- python浏览器 (32)
- python 请求 (32)
- python 前端 (32)
- python验证码 (33)
- python 题目 (32)
- python 文件写 (33)
- python中的用法 (32)