点击右上角微信好友
朋友圈
请使用浏览器分享功能进行分享
一、数据分类分级的必要性
伴随智慧医院建设,许多医院应用数字化和健康医疗大数据,提供精准预约、智能预问诊、处方外配、临床辅助决策、专病研究等数据服务,提升患者就医体验、医疗质量和医院管理能力。医院的健康医疗数据一方面为智慧医院建设提供重要支撑,蕴含着巨大价值,另一方面也隐含了大量的个人隐私,隐藏着巨大的数据安全风险。如何开展数据安全治理工作,防范健康医疗数据泄露、保护患者个人隐私,以充分释放健康医疗数据的价值,是摆在医院CIO们面前的一道难题。
依据国际咨询机构Gartner的数据安全治理框架,数据分类分级是数据安全治理过程中至关重要的环节,是数据安全保护工作开展的前置条件。网络安全等级保护工作的保护对象是重要的信息系统,而医院数据安全治理工作的保护对象是敏感数据。如果不知道医院内部的拥有哪些数据,不知道数据分布在哪里,不清楚数据的含义,不了解哪些是敏感数据,将导致医院的数据安全保护工作难以有效的开展。因此,医院在开展数据安全治理工作时,首先需要开展医院数据分类分级工作,对医院的健康医疗数据进行盘点与识别,按照既定标准进行归类、确定等级,才能明确哪些数据需要重点保护、需要如何保护、哪些数据可以开放共享、如何开放共享等问题,才能让数据的保护工作有理有据有序的开展起来,才能切实提高数据安全保护的效率和效果。
同时,医院基于数据分类分级开展数据保护工作,也是具有法律依据的。2021年颁布实施的《中华人民共和国数据安全法》明确要求应当对数据实行分类分级保护,《中华人民共和国个人信息保护法》明确规定对个人信息进行分类保护。
二、数据分类分级工作的复杂性
尽管明确了数据分类分级工作,在数据安全治理工作中的重要性。对于许多医院CIO来说,数据分类分级该从何做起,该怎么做,依然是一件十分困难的事情。
01 如何选择数据的分类维度
临床科研数据中心建设过程中进行的数据分类,通常是根据业务类别、数据来源、数据用途等多个维度,对业务数据进行划分,将同类型数据存放在一起,便于快速查找需要的内容和数据开发利用,但是通常忽略了数据安全合规保护的需要。
02 如何定义数据的安全等级
在健康医疗数据分级时,需要找到一个合适的级数别,使得在使用过程中达到效率和安全管控的平衡。过多的分级会给实际使用带来困难,太少的分级又会使得管控难以精准地约束数据;对数据定义过高的安全等级,则直接影响数据的开发利用和共享交换,对数据定义过低的安全等级,有可能无法达到数据合规保护的要求。
03 如何提升数据分类分级工作效率
健康医疗数据数量庞大,许多大型三甲医院仅仅HIS系统就有超过1万张数据表,单纯依靠人工进行分类分级打标是极大的工作量,且难以追踪数据资产变化。如何提升分类分级效率,降低工作量,是数据分类分级落地的实质性难题。
三、健康医疗数据分级分类实践思路
医院的健康医疗数据分类分级工作,可以通过五个步骤来进行实施,见下图。
01 圈定范围
分类分级建设的第一步是圈定分类分级的范围,明确数据的管理主体。圈定分类分级的范围才能针对性的建立组织保障体系,明确主体责任。数据管理主体的确定是数据分类准确性和定级准确性的基本保证。
02 建立组织保障
医院数据分类分级工作是一项庞大的工程,涉及到医院的数十个医疗信息系统及其软件供应商。因此,数据分类分级工作的开展,需要获得医院领导和各个相关部门的支持,做好各个相关部门和医疗软件供应商的沟通协调工作。组建专门的团队、制定工作流程和制度、确定专门的决策团队和领导人,以保证分类分级工作可正常有序的开展。
03 制定分类分级标准
针对数据分类维度选择、数据安全等级定义的问题,可以参考《信息安全技术 健康医疗数据安全指南》(GB/T 39725-2020)、《信息安全技术个人信息安全规范》(GB/T35273-2020)及其他行业标准,制定符合医院的健康医疗数据分类分级标准。
下表是依据《信息安全技术 健康医疗数据安全指南》的一个数据分类表。
根据医疗数据重要程度、风险级别、可能造成的损害以及影响的级别,可以将数据分为以下五个安全级别,五级数据的安全防护要求最高,下表是《信息安全技术健康医疗数据安全指南》中的医疗数据安全等级定义。
下表是结合某三甲医院实际情况和数据安全合规保护要求,制定的医院数据分类分级规范示例(部分)。
04 数据资产发现
接下来是针对确定范围内的医疗信息系统数据库,开展数据资产发现工作。通常是通过专门的数据资产发现工具,使用配置的医疗信息系统数据库账号、数据库IP、实例等信息,连接数据库进行自动化的数据资产扫描,获取数据库schema、数据表、视图、数据表字段、存储过程、触发器等信息,数据资产发现工具依据获取的这些信息,生成医院的数据资产目录。
05 分类分级打标
最后,依据所制定的医院健康医疗数据分类分级标准,通过数据资产分析工具对数据源自动扫描分析并结合人工审核,对数据资产进行分类分级打标,标识敏感数据,识别敏感数据资产,进行分类统计,形成医院的敏感数据资产目录。
需要特别提到的是,由于健康医疗数据格式复杂多样,尽管数据资产分析工具使用正则匹配、机器学习、NLP自然语言处理等模型算法能极大提升数据文本分类的识别率和准确率,但是仍然需要结合人工对数据分类结果进行审核,对数据分类识别规则进行优化和运营。
四、结语
随着国家“健康中国2030”战略的推进,“三位一体”智慧医院建设工作的深化,数据安全和个人信息保护相关法律法规的持续健全,健康医疗数据安全将成为各级卫生医疗行政主管机构、各级卫生医疗机构的重点工作。与网络安全等级保护建设一样,医院的数据安全治理工作是一个持续和漫长的过程,健康医疗数据分类分级仅仅是数据安全治理工作的开始。通过建立医院网络信息与数据安全管理机构,制定医院数据安全管理制度,持续推进和实施数据安全管理和保护工作,提升数据安全治理与开发利用的技术水平,才能从容应对数据安全风险与挑战,让健康医疗数据发挥最大价值。