作者:白永亮 刘重阳 胡欣 王盼
目 录
1. 背景
2. 业务挑战
3. 解决方案概述
4. 核心功能
5. 部署和上线流程
6. 信息安全与合规
1.背景
个例报告的处理活动在药物警戒部门的所有工作中通常占据60%~70%的比重。过去十年各式各样的人工智能方法与工具不断的在各个领域落地,与其他行业相比,AE报告处理的一个关键区别在于其数据结构的高度复杂性,并且全程需要在高度监管与审计的条件下进行。此外,大多数的源文件仅是半结构化或者完全非结构化的。
近几年,机器学习与NLP技术迅猛发展,在多个领域证明了其面对复杂文本时的处理能力与工作效率。今天,以机器学习和NLP技术为基础的AI模型产品为AE报告的自动化采集与录入工作带来了新的变革机会,而这有望帮助企业药物警戒部门实现显著的降本增效。
2.业务挑战
当前主流工作模式下:
1.对于邮件、扫描件等各个来源的个例安全报告,每天人工逐一读取、整理和录入结构化信息,费时费力易出错、员工价值感低容易流失。
2.病例报告的交付质量依人而异,而且新人培训周期长,录入质量又影响后续评估和上报。
3.大部分的病例报告只需做机械录入,却占用80%的时间,重复劳动影响高级PV人员参与风险评估、信号挖掘等高价值任务。
4.对于企业而言,对药物警戒部门的投入变得越来越不划算。
一个较为典型的工作情景是:一位PV助理每天需处理30封邮件,人工读取、筛选字段、录入系统,耗时6小时以上,错误率超过5%,而AI Intake工具上线后,同样工作只需30分钟。
3.解决方案概述
eSafety intake是太美医疗科技推出的AI 产品,其通过智能化方式进行作业,实现不良事件报告从“文档”到“数据库”的自动化通道,是企业构建
智能药物警戒体系的基础设施之一。它主要由以下组件构成:
1.源文档接入模块
2.OCR识别模块
3.AI模型模块
4.结构化输出模块
5.eSafety API接口写入模块
eSafety intake可共享eSafety数据库的通用配置,实现整个系统的用户管理和数据安全,帮助eSafety数据库用户降低整体运营成本。
4.核心功能
eSafety intake提供了一些关键功能,整个流程中PV人员无需手动处理文档内容,真正实现AI接管重复劳动。
(1)Intake任务的创建与管理
eSafety数据库为eSafety intake提供了专门的“intake任务管理”菜单,用户通过手动上传原始资料的方式生成待办任务,用户可执行编辑、删除、
查询等常规任务管理动作。
用户可通过筛选、查看任务状态来了解待办任务的执行情况,必要时可进行人工干预。
(2)eSafety intake与 eSafety的协同
eSafety数据库中引入了新角色来支持eSafety intake,允许用户管理intake任务。
eSafety intake可直接执行intake待办任务,自动提取源文档字段信息,并根据预设的提示词生成个例报告草稿。对于明确知晓关联关系的随访报告,用户可将eSafety数据库中对应的报告编号关联至待办任务,eSafety intake将跳过查重步骤执行随访报告的写入。
(1)API接口准入校验:校验个例报告草稿是否匹配当前数据库已维护的项目信息、产品信息,如具备相应信息,允许写入,否则拒绝并在intake任务中提示拒绝原因。
(2)查重:eSafety intake为用户提供预设的查重规则配置功能,个例报告草稿根据查重结果进入不同的工作流程分支。
(3)待人工处理任务:当查重检索显示多个报告编号,且用户未在intake任务中指定报告编号时,intake任务停留在待人工处理状态,由intake用户进行人工处理。
(4)创建首次报告:查重未检索到有前述报告版本时自动创建首次报告。
(5)创建随访报告:查重检索结果唯一或用户intake任务中直接绑定了eSafety数据库报告编号时,如该报告为已完成状态则创建随访报告,创建随访报告时intake将汇总eSafety数据库中已有的报告信息和新的源文档信息进行智能合并处理,并将合并后的内容写入数据库。
(6)创建待合并任务:查重检索结果唯一或用户intake任务中直接绑定了eSafety数据库报告编号时,如该报告仍未完成处理,由用户手动决定是否覆盖当前处理中的报告内容,执行覆盖操作时intake将汇总eSafety数据库中已有的报告信息和新的源文档信息进行智能合并处理,并将合并后的内容写入数据库。
(3)Intake任务审计日志
用户可查看intake任务执行稽查痕迹来了解所有工作流任务的完整历史记录,审计跟踪功能自动记录用户创建intake任务、编辑intake任务和执行创建案例的所有操作。
(4)Intake模块的迭代优化
由于AI模型存在一定概率的“幻觉”现象,Intake写入的报告需要进行人工质控。
质控人员可在eSafety数据库中使用修订模式来更正错误写入的字段内容,并在积累若干份报告后导出QC报告,联系太美intake服务团队进一步优化intake的AI模型参数。
对于个例报告多记录信息,如存在整条记录未识别写入的情况,用户可使用“工作日志”功能进行记录,并在积累若干份报告后通过配套的统计报表汇总导出,联系太美intake服务团队针进一步优化intake的AI模型参数。
(5)可视化任务监控
配合intake工具的交付,我们在eSafety统计分析模块下增加专门的intake监控和迭代看板,用户可在该看板下查看intake任务的关键绩效指标,例如成功创建个例报告的百分比、intake任务失败的原因分布,intake任务的执行时长分布等。
5.部署和上线流程
eSafety intake从部署到上线一般为2~4周,SaaS模式交付条件下,用户可申请eSafety intake产品验证文档用于各类验证场景。本地部署模式交付条件下,可根据客户需要付费执行本地部署验证并撰写文档进行交付。
一般而言,eSafety intake可处理的PDF源文件大小应限制在10页/份以内,eSafety intake上线交付KPI可以设定为:针对约定的SAE报告模版,个例报告字段识别率不低于80%,字段值识别准确度不低于80%。
6.信息安全与合规
Intake模块工作过程中,在OCR识别和AI模型调用阶段会涉及文档数据的暴露,被暴露文档数据客观上存在信息安全风险,信息安全风险又可以概括为是否涉及数据出境以及SAE报告数据是否被默认用于AI模型等软件的训练两种类型。
SaaS模式下,太美intake实施团队为用户选用明确承诺支持不主动利用客户数据进行AI训练的、不涉及数据出境的商业软件来搭建intake模块,并向用户交付相关组件的公开的隐私保护协议,示例如下图所示。
本地部署方式下,intake模块的信息安全问题由用户自行负责。