工程项目是重资产类企业投资的主要内容,对于以电网建设为主责主业的供电企业,其工程项目更是数量众多、涉及面广。工程项目审计是企业内外部高度关注的焦点,传统方式的电网工程项目审计,受条件所限,审计工作往往质效不高。随着大数据和人工智能技术的发展,数智化审计已日益成为电网工程项目审计工作的现实需要。本文以电网企业工程项目审计为例,探讨如何实施数智化审计。
电网工程项目审计范围涵盖工程内部控制和建设管理全过程,主要包括项目前期管理(包含投资立项、勘察设计等环节),项目实施管理(包含工程造价、采购管理、合同管理、物资管理、工程实施等环节)以及项目竣工和后续管理(包含竣工验收、竣工决算和工程后评价等环节,并对经济效益开展后评审)。
审计人员在开展电网工程项目审计时,需要结合以下资料进行全面核查,以判断工程项目是否符合技术标准和规范,是否合规、合理、有效。资料包括但不限于:电网工程项目合同、协议以及其他文件;电网工程项目规划设计、施工图纸、预算方案以及验收资料等;电网工程项目中相关部门、单位审核、批准、验收文件等;电网工程项目中技术资料、技术总结、设计计算以及现场检测结果等;电网工程项目相关财务资料,包括财务报表、会计凭证、投资总额计划及投入情况汇总等;电网工程项目的调查文件和有关项目实施的记录资料,包括项目批复、验收报告、安全检查记录、项目签证等。
以国网公司所属的地市供电企业为例,电网工程项目报审资料来源多样,既有线上方式的系统数据,也有线下提供的现场图纸,审计场景较为复杂。当前,电网工程项目审计过程中主要存在数据获取难、数据处理难、数据核对难等困难。
迄今为止,数智化审计还没有一个明确的学术定义。本文探讨的数智化审计是指利用大数据、人工智能、机器学习等现代信息技术手段,对企业财务和业务数据进行全面、深入的分析和挖掘,以提高审计工作质效的一种审计工作方式。相比传统审计,数智化审计具有高效、准确、客观、全面、预警等优势,是未来审计工作的必然趋势。
光学字符识别(Optical Character Recognition,简称OCR)是一种将纸质文档或图片中的印刷体文字转换成数字化文本的技术。OCR技术可以自动解析扫描后的纸质文档或图片文件中的文字,将其转换成计算机可读格式,以便进行后续处理和存储。在审计工作中,OCR技术可以帮助审计人员快速准确地识别大量的纸质文档和图片文件中的文字,减少手工输入错误和漏洞,提高审计效率和准确性。
流程自动化机器人(Robotic Process Automation,简称RPA)是一种使用软件机器人(或“机器人”)自动执行业务流程中重复和单调任务的技术。RPA机器人可以模拟人类操作,实现对计算机中各种应用程序和系统的访问、交互和控制,从而完成预定义任务和流程。在审计工作中,RPA机器人可以帮助审计人员快速、精准地完成重复性数据分析和处理工作,如数据抽取、数据核对、异常检测等。
三、数智化审计在电网
工程项目审计中的探索
在电网工程项目实施过程中,存在大量非结构化的数据。这些电网工程项目文件有时是纸质文件,有时是以照片形式保存的文件,给审计人员核对校验工作带来很大不便。核验过程中,审计人员需要通过翻阅相关文件,并将这些文件中的信息手工录入,将内容转化为结构化数据后,才能再进行数据的统计分析,从而影响了工作质效。
通过使用惠普公司旗下开源的Tesseract-OCR引擎,将图片和PDF格式保存的文件批量转换为可编辑文件格式,探索实现基于OCR技术的电网工程项目文件内容自动识别。
1.图像纠偏。
对于通过扫描、拍照形成的电网工程项目文件,由于人工操作原因,图像倾斜的情况时有发生,倾斜图片严重影响文字识别正确率,因此,在文字识别前必须对倾斜图像进行校正检查。
2.内容识别。
(1)JPG、PNG等一般图片文件内容识别。
对于JPG、PNG等一般图片格式的文件,可以利用Tesseract-OCR直接进行图片中文字识别。
(2)TIF格式文件内容识别。
TIF文件一般会包含多张扫描图片,在内容识别时,需要先分别识别各张图片内容,然后再对识别的内容进行合并处理。
(3)PDF格式文件内容识别。
PDF文件可以使用PyMuPDF第三方库,将PDF文件逐页转换成图片,再对各个图片进行内容识别。
1.报审资料“全不全”审核。
对报审工程项目资料进行初核,是电网工程项目审计过程中一项重要内容。电网工程项目各阶段资料文件都有相对固定的格式,能够缩小信息识别范围、降低数据抓取难度,为机器人自动审核提供了便利。
基于RPA技术的电网工程项目报审资料自动审核,通过预先配置好各类型电网工程项目的报审资料库,由电网工程项目建设单位根据工程项目类别自定义配置本项目审计所需的标准化报审资料包。在满足共性管理需求的同时,也能满足差异化管理要求。
以常见的0.4kV配网工程项目为例,结算审计报审资料包括但不限于:设计图、预算书、竣工图、结算书、开(竣)工报告、验收报告、甲供材实耗表、工程签证单、隐蔽工程验收记录、设计变更单、施工合同等。
报审人员将报审文件放入对应文件夹,RPA机器人可自动检测其文件完整性,在报审文件出现残缺时第一时间反馈至相关审计人员,使其及时发现、搜集缺失文件。
审计人员只需选取报审电网工程项目资料文件夹,就可以通过程序按照自定义配置报审资料包清单,对报审电网工程项目资料进行逐项审核,分析判断送审资料是否满足报审要求,审核过程自动记录留痕并能即时生成审核结果,包括但不限于:项目报审资料中已通过审核的文件名称、数量,尚未通过审核的文件名称、数量,最终的审核结论等信息。
2.报审资料“对不对”审核。
大部分报审资料的数据在时间或者数额上都具有一定逻辑关系。通过预设一定的审计规则,让RPA机器人能够明确各数据之间的正确关系,并将识别后的结构化信息按照规则进行判别,完成对数据逻辑错误的自动审核。
(1)报审资料包内的数据能否对应。
审核报审资料包中资料的时间顺序、金额等的对应情况。
(2)报审资料与系统数据能否对应。
在完成报审资料包内资料数据对应审核的基础上,通过RPA机器人对进行报审资料与系统数据的对应情况审核。
四、电网工程项目数智化审计成效
通过OCR技术,让电网工程项目报审资料中的图片、扫描件等非结构化资料能够持续进行自动识别,保证了在数智化条件下多源数据“进得来”并为审计人员所用,为后续审计分析阶段,分析模型进行大数据比对、查找审计问题提供有力支撑。
过去,审计人员每天在电网工程项目报审资料审核中能完成的初核工作量有限,同时也难以保证对报审资料全部内容都关注到。RPA机器人让电网工程项目数据自动审核成为可能。审计人员配置好审核逻辑规则之后,RPA机器人自动运行,并能快速反馈检查结果,在减轻审计人员工作强度的同时,极大提高审计工作质效。
电网工程项目数智化审计是针对电网工程投资大、多、杂、散的特点,在数智化快速发展的环境下,不断探索和尝试下的成果,具有持续深化发展的生命力。通过电网工程项目数智化审计,服务电网企业数字化转型所需,护航电网工程项目精益建设、管理。
五、电网工程项目数智化审计展望
未来,随着信息技术不断发展和应用,电网工程项目数智化审计将呈现出新的、更多可能,全流程、全覆盖、高效率的审计目标将逐步变为现实。同时,随着数据质量和规模的不断提升,电网工程项目数智化审计还将实现数据共享、风险控制、审计结果可视化等,这会极大推动电网工程项目审计现代化进程,并持续提升数智化审计工作质效。
文章摘自《中国内部审计》杂志2023年第7期
作者:郑宏奕 刘霞 赵卫明 聂彤云 王美丽
单位:国网山东省电力公司滨州供电公司
编辑:孙哲