当前位置:三门峡市审计局 > 经验介绍 > 文章详情

浅析python在审计中的运用

发布时间:2024-09-20 08:50 来源:陕州区审计局 作者:王乾懿

陕州区审计局在开展2023年度财政预算执行和其他财政收支情况审计中,审计组通过Python的OCR库,将被审计单位所提供的图片证据转换成表格形式,探索大数据环境下的审计创新方式方法。

将被审计单位提供的照片信息(假设是JPEG、PNG等图像格式)转化为Excel表格,通常涉及以下几个步骤:

一、图像预处理:如果图像中的表格线不够清晰,或者背景干扰了OCR的识别,可能需要进行预处理,如灰度化、二值化、去噪等。

二、OCR识别:使用OCR(光学字符识别)技术从图像中提取文本。

三、表格结构识别:识别出文本中的表格结构,这可能需要额外的算法或库,因为标准的OCR库通常只提供文本识别功能,而不直接提供表格结构识别。

四、数据解析和重组:将OCR识别出的文本按照表格结构进行解析,并重组为表格数据。

五、保存为Excel:使用Python的库(如pandas和openpyxl)将解析后的表格数据保存为Excel文件。

 

撰稿人:王乾懿

审核人:潘


按回车键在新窗口打开无障碍说明页面,按Ctrl+~键打开导盲模式。