首页 > 最新动态 > 审计视角下以数据治理提升数据质量路径初探——以A城市商业银行为例
最新动态
审计视角下以数据治理提升数据质量路径初探——以A城市商业银行为例
2025-12-0434

随着数字经济的发展,数字经济与实体经济快速融合,数字经济正成为国家经济、社会进步、企业发展的新引擎,发展数字经济是企业数字化转型的必由之路。银行数字化是促进经济体系产融结合,助力银行经营降本增效的核心战略规划。在数字经济背景下,银行内部审计工作要实现高质量发展也迫切需要推进数字化转型升级,关键是要加强基础数据源头治理。本文以A城市商业银行(以下简称A银行)为例,浅析如何在审计视角下开展数据治理以提升数据质量,并结合实际案例阐述数据治理工作对内部审计数字化转型的重要意义及实现路径。





一、数据治理背景


随着信息技术的飞速发展,审计工作方法和管理模式也发生了变化。实践证明,“数字赋能”对内部审计转型和发展具有重要意义,能够有效提升审计质量和监督效能,促进企业提高风险防控水平。根据中国人民银行印发的《金融科技发展规划(2022-2025)》和原中国银保监会发布的《关于银行业保险业数字化转型的指导意见》等文件的要求,A银行审计部(以下简称审计部)在总行党委指导下,结合内部审计工作实际积极谋划,重点围绕“数据+技术+平台”夯实基础数据平台建设,提升数据治理能力,落地数据治理成果,实现数据资产化和数据价值变现,推动由碎片化的程序型审计向系统深入的研究型审计转变,不断提升内部审计增加价值能力。

近年来,审计部多次组织业务骨干前往中信、浦发、兴业、广发等股份制银行进行数字化转型先进经验调研。调研发现,数据是内部审计数字化转型的基础,也是数字化转型的难点问题。一是商业银行内部系统之间的“孤岛”现象成为数字化建设的软肋,缺少统一的数据标准或数据标准难以落地,突出表现为数据来源多头、定义不一致、格式不统一、交换困难。二是历史数据遗留问题突出,数据错误、冗余、缺失等质量问题已成为行业通病,严重影响大数据审计、大模型生态的发展。





二、数据治理实施


为提升数据质量,改善数据壁垒现状,提升数字化审计工作质效,A银行审计部数据治理工作组(以下简称工作组)牵头制定了数据治理框架,共涉及六大方面26项具体内容,旨在统一多源异构数据标准,提高数据可用、可信程度,充分发挥数据驱动价值(见图1)。

1.jpg

数据治理是一项系统长期工作,并非通过单一项目即可完成。按照审计数据治理框架,审计部确定了“审计数据治理一期工程”的工作重点。一是数据的标准化处理,对已接入审计系统的业务数据进行过滤清洗,并完成码值转换;统一数据表结构,规范数据表、字段标准,实现数据准确表达及提取。二是数据的验证与应用,梳理A银行业务条线数据结构,编制源系统数据字典,确定数据表存储内容和数据表之间的逻辑关系;根据审计工作需要,借助审计工具构建大数据监测模型。具体实施步骤可细分为四个阶段。





(一)制定数据标准

审计部组织业务骨干与技术支持人员进行多次座谈交流,重点围绕审计接入数据质量及数据应用等方面展开讨论,针对行业数据质量共性问题提出建议,在A银行数字化转型发展规划指引下,制定《审计数据治理工作方案》,并按照方案内容,制定《审计数据标准规范》,进一步明确审计数据治理工作的主要内容和质量标准。


(二)规范数据展现形式

针对审计接入数据来源多、格式不统一、定义不一致等数据规范问题,工作组对审计系统已接入的数据表进行了梳理。一是甄别数据表内容。工作组通过与行内数据仓库、上游业务系统等联络人沟通交流,对审计接入数据表进行逐表分析,确保数据表命名能够准确表达其业务含义。二是规范数据表命名。根据审计工作需要,对数据表名、字段名进行了重新定义,剔除了元数据表中的特殊字符,将数据表名及其字段全部转换为中文,降低了审计人员数据应用的难度。三是分类展示数据。审计系统按照“业务数据/源系统简称/数据表名”三级目录进行数据表展示;同时,在同一系统中,针对不同业务属性的数据表进行了分类展示处理,提升了审计人员查找效率。


(三)数据清洗与转换

数据清洗与转换是数据治理工作的难点,针对失效、冗余等数据质量问题,工作组对审计系统已接入的数据进行了过滤清洗。一是确保数据完整性。使用脚本比对审计数据集市与行内数据仓库,对每张数据表的记录数、字段个数、字段排序、空值等指标进行比对,验证数据接入的完整性,并补齐缺失的记录和字段。二是确保数据唯一性。通过表结构主键或唯一标识符,检查数据表中是否存在重复记录,删除失效、冗余的数据记录。三是确保数据有效性。通过数据类型特征,对日期类、数值类、字符类等数据进行特征值分析,检查数据是否满足用户定义条件、是否在一定值域内,修正存在明显错误和域外的数据。

针对接入数据转码错误、无效转码、码值不全等转码问题,工作组对审计系统已接入的数据进行了码值转换。一是确保码值完整性。通过行内数据仓库推送数据比对和源业务系统调研,获取关键字段的中文注释,完成对审计系统已接入数据关键字段码值转换。二是确保码值唯一性。通过脚本去重判断关键字段的码值是否唯一,避免出现一对多的问题。三是确保码值有效性。根据审计工作需要,对需要转码的关键字段能转尽转,剔除释义表达错误的码值,为审计人员准确获取每个字段的含义奠定基础。


(四)数据验证与应用

为充分验证审计数据治理成果,工作组在数据治理过程中编制了数据字典,并将数据字典转发至各审计团队,各审计团队对审计数据治理成果进行了验证和应用。一是验证数据要素与业务含义表达是否准确一致。二是验证码值转换情况。是否按照前期各审计团队提出的转码需求完成关键字段能转尽转,并对转码结果进行验证。三是推动审计数据应用。以“培训+测试”的形式鼓励审计人员通过“模型分析”工具完成数据分析,进一步强化大数据审计应用。



三、数据治理成果



(一)建立审计数据标准,规范数据质量要求

自数据治理工作开展以来,工作组围绕《审计数据治理工作方案》,经过拟定、修正、完善等阶段,完成了《审计数据标准规范》的制定,分别从命名规范、数据展示、数据清洗、数据转换、数据存储五个方面,提出了审计数据治理工作要求,进一步明确了审计数据治理工作的质量和标准,为审计数据治理工作的开展和后续审计数据的接入提供了制度遵循,指明了方向。


(二)完成审计数据治理,提升审计数据质量

工作组经过数据梳理、数据标准化处理、数据验证等方式,通过多方调研了解、比对核实,历经5个月的时间,顺利完成了审计数据集市全部数据表的数据治理工作,提高了审计数据质量。在数据治理成果的基础上,审计部重点围绕数据治理、数据分析、模型建设等先后开展了两次培训,并将成果运用到审计项目疑点筛选、线索核查过程中,显著推动了数据服务、模型服务在审计工作中的应用。


(三)形成审计数据字典,推动数据服务应用

为更好地推动大数据审计分析工作,此次数据治理通过“数据字典”的形式,对每一张数据表、每一个字段要素的真实含义进行了定义和说明,并建立了索引和目录,帮助审计人员快速厘清不同数据表之间的业务逻辑关系,降低了数据理解和应用难度,成为审计人员模型建设、数据分析的有效工具,有力推动了研究型审计的开展。



四、数据治理建议



(一)坚持数据标准先行,加强数据源头治理

商业银行审计系统数据多来自行内数据仓库,工作组调研发现,部分商业银行审计系统接入的数据中,字符类型占比较高,失去了原有日期类型、数值类型、布尔类型等数据类型的约束,致使数据采集过程中产生了大量的空格、斜杠、回车、换行等特殊字符,在未清洗的情况下,审计人员在进行数据分析时很难精准找到数据。因此,应开展数据源头治理,规范源系统业务数据类型,并在源系统数据入仓时,增加数据清洗和数据转换步骤,以减少下游系统使用数据的难度,进而提升数据整体质量和应用水平。


(二)建立源系统数据字典,推动数据精准反哺业务

数据字典是数据分析人员不可或缺的工具,工作组调研发现,部分商业银行业务系统存在数据字典缺失或不完整的情况,许多带有重要含义码值字段的中文注释缺乏系统性,审计人员进行数据分析时,无法快捷、清楚了解每一个字段所代表的真实含义。应由源系统的管理部门牵头,将数据字典纳入本行资产管理,在新建系统时同步完成数据字典的编写工作;对于存量系统,应组织相关人员重新编制数据字典,规范数据标准,以提高数据质量,推动数据精准反哺业务。


(三)数据分层分级管理,提升数据分析效率

工作组经统计发现,很多单个元数据表结构中虽然字段要素较多,但审计人员关注的真正具有业务含义的字段要素,如客户类、交易类、日期类、状态类等,占比不足50%,其余字段要素均为数据关联、数据转换等元数据管理而设置,这对于非科技背景的审计人员来说,理解起来比较困难。应通过采取中间表的形式,对元数据进行数据清洗、转换、汇总计算,生成中间业务表后加载到审计数据集市,以降低审计人员数据理解难度,提升数据分析效率。


(四)规范数据采集机制,扩大数据采集范围

审计系统可开拓多种数据结构、多种数据接入方式,加强半结构化、非结构化数据的获取,以拓展审计范围及深度。除了获取常规业务系统数据,还应确保Excel报表数据的无缝接入;利用Python、NLP、RPA语言实现网络爬虫数据的获取和处理,借助OCR、ASR、Hadoop工具实现音视频、图像等非结构化数据的获取和处理;建立标准的数据ETL机制,清洗错误、冗余的垃圾数据,补全缺少的数据元素,做好码值转换,最后分类存储、归集到不同的标准数据库中(见图2)。通过以上措施,努力实现“三个提升”,即大幅提升海量数据的分析效率,提升非结构化数据的处理和分析能力,提升多角度、深层次挖掘问题的能力。

ScreenShot_2025-11-11_103405_671.jpg


(五)注重实战锻炼,组建攻坚克难“突击队”

数据治理只是数字化转型的基础,数据赋能才是数字化转型的目标。随着内部审计数字化转型的不断深入,商业银行内部审计面临的最大挑战是数字化人才的短缺。商业银行迫切需要结合本行实际情况,组建一支攻坚克难“突击队”来引领数字化转型。一是通过以干促学、以考促训等方式,营造良好的“学科技、用科技、谋科技、推科技”工作氛围。二是充分发挥人才第一资源效能,通过自主分析、模型构建等方法,依托SQL编辑器、模型分析、数据挖掘等工具开展大数据审计,助力审计项目疑点分析,持续扩展内部审计的能力边界


五、结语


本文结合当前数字经济发展的时代背景,通过多种方式调查研究、剖析、归纳了影响内部审计数字化转型的关键因素,分别从数据标准制定、规范数据展现形式、数据清洗与转换、数据验证与应用四个阶段介绍了数据治理实施步骤,最后对数据治理成果进行了总结并提出了数据治理建议。

随着数字经济的发展,商业银行内部审计在数字化转型过程中,仍需重点围绕数据质量、数据合规、数据安全等方面开展审计智能化研究,突出审计“促战略、控风险、查合规、强能力”作用,推动实现内部审计高质量发展。




文章摘自《中国内部审计》杂志2025年第7期

作者:马帅

单位:天津银行审计部


编辑:孙哲



目前190000+人已关注我们,您还等什么?
图片


图片
“阅读原文”一起来充电!

点我访问原文链接