新闻中心
太美医疗科技发布《个例安全报告智能录入白皮书》

作者:白永亮 刘重阳 胡欣 王盼

 

目 录

1. 背景

2. 业务挑战

3. 解决方案概述

4. 核心功能

5. 部署和上线流程

6. 信息安全与合规

 

1.背景

个例报告的处理活动在药物警戒部门的所有工作中通常占据60%~70%的比重。过去十年各式各样的人工智能方法与工具不断的在各个领域落地,与其他行业相比,AE报告处理的一个关键区别在于其数据结构的高度复杂性,并且全程需要在高度监管与审计的条件下进行。此外,大多数的源文件仅是半结构化或者完全非结构化的。

近几年,机器学习与NLP技术迅猛发展,在多个领域证明了其面对复杂文本时的处理能力与工作效率。今天,以机器学习和NLP技术为基础的AI模型产品为AE报告的自动化采集与录入工作带来了新的变革机会,而这有望帮助企业药物警戒部门实现显著的降本增效。

 

2.业务挑战

当前主流工作模式下:

1.对于邮件、扫描件等各个来源的个例安全报告,每天人工逐一读取、整理和录入结构化信息,费时费力易出错、员工价值感低容易流失。

2.病例报告的交付质量依人而异,而且新人培训周期长,录入质量又影响后续评估和上报。

3.大部分的病例报告只需做机械录入,却占用80%的时间,重复劳动影响高级PV人员参与风险评估、信号挖掘等高价值任务。

4.对于企业而言,对药物警戒部门的投入变得越来越不划算。

一个较为典型的工作情景是:一位PV助理每天需处理30封邮件,人工读取、筛选字段、录入系统,耗时6小时以上,错误率超过5%,而AI Intake工具上线后,同样工作只需30分钟。

 

3.解决方案概述

eSafety intake是太美医疗科技推出的AI 产品,其通过智能化方式进行作业,实现不良事件报告从“文档”到“数据库”的自动化通道,是企业构建

智能药物警戒体系的基础设施之一。它主要由以下组件构成:

1.源文档接入模块

2.OCR识别模块

3.AI模型模块

4.结构化输出模块

5.eSafety API接口写入模块

eSafety intake可共享eSafety数据库的通用配置,实现整个系统的用户管理和数据安全,帮助eSafety数据库用户降低整体运营成本。

 

4.核心功能

eSafety intake提供了一些关键功能,整个流程中PV人员无需手动处理文档内容,真正实现AI接管重复劳动。

 

(1)Intake任务的创建与管理

eSafety数据库为eSafety intake提供了专门的“intake任务管理”菜单,用户通过手动上传原始资料的方式生成待办任务,用户可执行编辑、删除、

查询等常规任务管理动作。

用户可通过筛选、查看任务状态来了解待办任务的执行情况,必要时可进行人工干预。

 

(2)eSafety intake与 eSafety的协同

eSafety数据库中引入了新角色来支持eSafety intake,允许用户管理intake任务。

eSafety intake可直接执行intake待办任务,自动提取源文档字段信息,并根据预设的提示词生成个例报告草稿。对于明确知晓关联关系的随访报告,用户可将eSafety数据库中对应的报告编号关联至待办任务,eSafety intake将跳过查重步骤执行随访报告的写入。

(1)API接口准入校验:校验个例报告草稿是否匹配当前数据库已维护的项目信息、产品信息,如具备相应信息,允许写入,否则拒绝并在intake任务中提示拒绝原因。

(2)查重:eSafety intake为用户提供预设的查重规则配置功能,个例报告草稿根据查重结果进入不同的工作流程分支。

(3)待人工处理任务:当查重检索显示多个报告编号,且用户未在intake任务中指定报告编号时,intake任务停留在待人工处理状态,由intake用户进行人工处理。

(4)创建首次报告:查重未检索到有前述报告版本时自动创建首次报告。

(5)创建随访报告:查重检索结果唯一或用户intake任务中直接绑定了eSafety数据库报告编号时,如该报告为已完成状态则创建随访报告,创建随访报告时intake将汇总eSafety数据库中已有的报告信息和新的源文档信息进行智能合并处理,并将合并后的内容写入数据库。

(6)创建待合并任务:查重检索结果唯一或用户intake任务中直接绑定了eSafety数据库报告编号时,如该报告仍未完成处理,由用户手动决定是否覆盖当前处理中的报告内容,执行覆盖操作时intake将汇总eSafety数据库中已有的报告信息和新的源文档信息进行智能合并处理,并将合并后的内容写入数据库。

 

(3)Intake任务审计日志

用户可查看intake任务执行稽查痕迹来了解所有工作流任务的完整历史记录,审计跟踪功能自动记录用户创建intake任务、编辑intake任务和执行创建案例的所有操作。

 

(4)Intake模块的迭代优化

由于AI模型存在一定概率的“幻觉”现象,Intake写入的报告需要进行人工质控。

质控人员可在eSafety数据库中使用修订模式来更正错误写入的字段内容,并在积累若干份报告后导出QC报告,联系太美intake服务团队进一步优化intake的AI模型参数。

对于个例报告多记录信息,如存在整条记录未识别写入的情况,用户可使用“工作日志”功能进行记录,并在积累若干份报告后通过配套的统计报表汇总导出,联系太美intake服务团队针进一步优化intake的AI模型参数。

 

(5)可视化任务监控

配合intake工具的交付,我们在eSafety统计分析模块下增加专门的intake监控和迭代看板,用户可在该看板下查看intake任务的关键绩效指标,例如成功创建个例报告的百分比、intake任务失败的原因分布,intake任务的执行时长分布等。

 

5.部署和上线流程

eSafety intake从部署到上线一般为2~4周,SaaS模式交付条件下,用户可申请eSafety intake产品验证文档用于各类验证场景。本地部署模式交付条件下,可根据客户需要付费执行本地部署验证并撰写文档进行交付。

一般而言,eSafety intake可处理的PDF源文件大小应限制在10页/份以内,eSafety intake上线交付KPI可以设定为:针对约定的SAE报告模版,个例报告字段识别率不低于80%,字段值识别准确度不低于80%。

6.信息安全与合规

Intake模块工作过程中,在OCR识别和AI模型调用阶段会涉及文档数据的暴露,被暴露文档数据客观上存在信息安全风险,信息安全风险又可以概括为是否涉及数据出境以及SAE报告数据是否被默认用于AI模型等软件的训练两种类型。

SaaS模式下,太美intake实施团队为用户选用明确承诺支持不主动利用客户数据进行AI训练的、不涉及数据出境的商业软件来搭建intake模块,并向用户交付相关组件的公开的隐私保护协议,示例如下图所示。

本地部署方式下,intake模块的信息安全问题由用户自行负责。