太美医疗科技发布《个例安全报告智能录入白皮书》-太美医疗科技

太美医疗科技发布《个例安全报告智能录入白皮书》

作者：白永亮刘重阳胡欣王盼

目录

1. 背景

2. 业务挑战

3. 解决方案概述

4. 核心功能

5. 部署和上线流程

6. 信息安全与合规

1.背景

个例报告的处理活动在药物警戒部门的所有工作中通常占据60%~70%的比重。过去十年各式各样的人工智能方法与工具不断的在各个领域落地，与其他行业相比，AE报告处理的一个关键区别在于其数据结构的高度复杂性，并且全程需要在高度监管与审计的条件下进行。此外，大多数的源文件仅是半结构化或者完全非结构化的。

近几年，机器学习与NLP技术迅猛发展，在多个领域证明了其面对复杂文本时的处理能力与工作效率。今天，以机器学习和NLP技术为基础的AI模型产品为AE报告的自动化采集与录入工作带来了新的变革机会，而这有望帮助企业药物警戒部门实现显著的降本增效。

2.业务挑战

当前主流工作模式下：

1.对于邮件、扫描件等各个来源的个例安全报告，每天人工逐一读取、整理和录入结构化信息，费时费力易出错、员工价值感低容易流失。

2.病例报告的交付质量依人而异，而且新人培训周期长，录入质量又影响后续评估和上报。

3.大部分的病例报告只需做机械录入，却占用80%的时间，重复劳动影响高级PV人员参与风险评估、信号挖掘等高价值任务。

4.对于企业而言，对药物警戒部门的投入变得越来越不划算。

一个较为典型的工作情景是：一位PV助理每天需处理30封邮件，人工读取、筛选字段、录入系统，耗时6小时以上，错误率超过5%，而AI Intake工具上线后，同样工作只需30分钟。

3.解决方案概述

eSafety intake是太美医疗科技推出的AI 产品，其通过智能化方式进行作业，实现不良事件报告从“文档”到“数据库”的自动化通道，是企业构建

智能药物警戒体系的基础设施之一。它主要由以下组件构成：

1.源文档接入模块

2.OCR识别模块

3.AI模型模块

4.结构化输出模块

5.eSafety API接口写入模块

eSafety intake可共享eSafety数据库的通用配置，实现整个系统的用户管理和数据安全，帮助eSafety数据库用户降低整体运营成本。

4.核心功能

eSafety intake提供了一些关键功能，整个流程中PV人员无需手动处理文档内容，真正实现AI接管重复劳动。

(1）Intake任务的创建与管理

eSafety数据库为eSafety intake提供了专门的“intake任务管理”菜单，用户通过手动上传原始资料的方式生成待办任务，用户可执行编辑、删除、

查询等常规任务管理动作。

用户可通过筛选、查看任务状态来了解待办任务的执行情况，必要时可进行人工干预。

(2）eSafety intake与 eSafety的协同

eSafety数据库中引入了新角色来支持eSafety intake，允许用户管理intake任务。

eSafety intake可直接执行intake待办任务，自动提取源文档字段信息，并根据预设的提示词生成个例报告草稿。对于明确知晓关联关系的随访报告，用户可将eSafety数据库中对应的报告编号关联至待办任务，eSafety intake将跳过查重步骤执行随访报告的写入。

(1)API接口准入校验：校验个例报告草稿是否匹配当前数据库已维护的项目信息、产品信息，如具备相应信息，允许写入，否则拒绝并在intake任务中提示拒绝原因。

(2)查重：eSafety intake为用户提供预设的查重规则配置功能，个例报告草稿根据查重结果进入不同的工作流程分支。

(3)待人工处理任务：当查重检索显示多个报告编号，且用户未在intake任务中指定报告编号时，intake任务停留在待人工处理状态，由intake用户进行人工处理。

(4)创建首次报告：查重未检索到有前述报告版本时自动创建首次报告。

(5)创建随访报告：查重检索结果唯一或用户intake任务中直接绑定了eSafety数据库报告编号时，如该报告为已完成状态则创建随访报告，创建随访报告时intake将汇总eSafety数据库中已有的报告信息和新的源文档信息进行智能合并处理，并将合并后的内容写入数据库。

(6)创建待合并任务：查重检索结果唯一或用户intake任务中直接绑定了eSafety数据库报告编号时，如该报告仍未完成处理，由用户手动决定是否覆盖当前处理中的报告内容，执行覆盖操作时intake将汇总eSafety数据库中已有的报告信息和新的源文档信息进行智能合并处理，并将合并后的内容写入数据库。

(3)Intake任务审计日志

用户可查看intake任务执行稽查痕迹来了解所有工作流任务的完整历史记录，审计跟踪功能自动记录用户创建intake任务、编辑intake任务和执行创建案例的所有操作。

(4)Intake模块的迭代优化

由于AI模型存在一定概率的“幻觉”现象，Intake写入的报告需要进行人工质控。

质控人员可在eSafety数据库中使用修订模式来更正错误写入的字段内容，并在积累若干份报告后导出QC报告，联系太美intake服务团队进一步优化intake的AI模型参数。

对于个例报告多记录信息，如存在整条记录未识别写入的情况，用户可使用“工作日志”功能进行记录，并在积累若干份报告后通过配套的统计报表汇总导出，联系太美intake服务团队针进一步优化intake的AI模型参数。

(5)可视化任务监控

配合intake工具的交付，我们在eSafety统计分析模块下增加专门的intake监控和迭代看板，用户可在该看板下查看intake任务的关键绩效指标，例如成功创建个例报告的百分比、intake任务失败的原因分布，intake任务的执行时长分布等。

5.部署和上线流程

eSafety intake从部署到上线一般为2~4周，SaaS模式交付条件下，用户可申请eSafety intake产品验证文档用于各类验证场景。本地部署模式交付条件下，可根据客户需要付费执行本地部署验证并撰写文档进行交付。

一般而言，eSafety intake可处理的PDF源文件大小应限制在10页/份以内，eSafety intake上线交付KPI可以设定为：针对约定的SAE报告模版，个例报告字段识别率不低于80%，字段值识别准确度不低于80%。

6.信息安全与合规

Intake模块工作过程中，在OCR识别和AI模型调用阶段会涉及文档数据的暴露，被暴露文档数据客观上存在信息安全风险，信息安全风险又可以概括为是否涉及数据出境以及SAE报告数据是否被默认用于AI模型等软件的训练两种类型。

SaaS模式下，太美intake实施团队为用户选用明确承诺支持不主动利用客户数据进行AI训练的、不涉及数据出境的商业软件来搭建intake模块，并向用户交付相关组件的公开的隐私保护协议，示例如下图所示。

本地部署方式下，intake模块的信息安全问题由用户自行负责。

医药研发·数智化解决方案

临床研究—药企端

临床研究—医院端

药物安全

医药研发·创新解决方案

临床研究 — 创新解决方案

临床研究 — 智能体

医药营销·数智化解决方案

无界—全域数智化营销平台

医药研发·创新服务

智慧临床运营

医学科学

数据科学

注册事务

药物安全监测

真实世界洞察

独立评估中心

患者智护平台