Inteligencia Artificial para optimizar el reclutamiento en Ensayos Clínicos sobre Degeneración Macular Relacionada con la Edad (DMAE)

Resumen

Objetivo

Los recientes desarrollos en inteligencia artificial (IA) la han posicionado para transformar varias etapas del proceso de ensayos clínicos. En este estudio, exploramos el papel de la IA en el reclutamiento de participantes para ensayos clínicos de personas con atrofia geográfica (AG), una etapa avanzada de la degeneración macular relacionada con la edad, en medio de numerosos ensayos clínicos en curso para esta afección.

Diseño

Estudio transversal

Sujetos, participantes y/o controles: Conjunto de datos retrospectivos del INSIGHT Health Data Research Hub del Moorfields Eye Hospital de Londres, Reino Unido, que incluye 306 651 pacientes (602 826 ojos) con sospecha de enfermedad retiniana que se sometieron a imágenes de tomografía de coherencia óptica (OCT) entre el 1 de enero de 2008 y el 10 de abril de 2023.

Métodos, intervención o pruebas

Se entrenó un modelo de aprendizaje profundo en exploraciones de OCT para identificar pacientes potencialmente elegibles para ensayos clínicos de AG, utilizando segmentaciones de tejido retiniano generadas por IA. La eficacia de este método se comparó con una búsqueda tradicional basada en palabras clave en la historia clínica electrónica (HCE). Se realizó una validación clínica con imágenes de autofluorescencia del fondo del ojo (FAF) para calcular el valor predictivo positivo (VPP) de este enfoque, comparando las predicciones de la IA con las evaluaciones de expertos.

Medidas de Resultado Principales

Los resultados principales incluyeron el valor predictivo positivo (VPP) de la IA en la identificación de pacientes elegibles para el ensayo, y el resultado secundario fue la correlación intragrupo entre las áreas de AG segmentadas en imágenes de autofluorescencia del fondo del ojo (FAF) por expertos y escaneos OCT segmentados por IA.

Resultados

El sistema de IA preseleccionó un número mayor de pacientes elegibles con mayor precisión (1,139, VPP: 63%; IC del 95%: 54–71%) en comparación con la búsqueda en EHR (693, VPP: 40%; IC del 95%: 39–42%). Un enfoque combinado de IA-EHR identificó 604 pacientes elegibles con un VPP del 86% (IC del 95%: 79–92%). La correlación intragrupo del área de AG segmentada en FAF versus el área segmentada por IA en OCT fue de 0.77 (IC del 95%: 0.68–0.84) para los casos que cumplían con los criterios del ensayo. La IA también se ajusta a los criterios de imagen distintos de varios ensayos clínicos, generando listas cortas personalizadas que varían de 438 a 1,817 pacientes.

Conclusiones

Este estudio demuestra el potencial de la IA para facilitar la preselección automatizada para ensayos clínicos en AG, permitiendo evaluaciones de la viabilidad del centro, diseño de protocolos basados en datos y reducción de costos. Una vez que los tratamientos estén disponibles, sistemas de IA similares también podrían usarse para identificar individuos que podrían beneficiarse del tratamiento.

Introducción

Lanzar un nuevo medicamento al mercado es costoso y lleva tiempo. El proceso desde el descubrimiento del fármaco hasta la aprobación puede durar de 10 a 15 años y costar aproximadamente mil millones de dólares. Los ensayos clínicos juegan un papel importante en este proceso, con importantes recursos dedicados a probar la seguridad y eficacia de cualquier tratamiento potencial. Hoy en día, las dificultades para el reclutamiento de participantes representan un obstáculo importante en los ensayos clínicos. El tiempo que se tarda en reclutar a todos los participantes de un ensayo aumenta significativamente el coste y puede provocar retrasos, ya que hasta el 86% de los ensayos no finalizan en la fecha prevista. Se han propuesto varios métodos para aliviar el problema del reclutamiento, incluidos los diseños de ensayos abiertos y la utilización de tecnología

La degeneración macular asociada a la edad (DMAE) es una de las principales causas de pérdida de visión en personas mayores de 50 años en países desarrollados. Una forma tardía de la enfermedad es la atrofia geográfica (AG), donde se pierde la visión central como resultado de la muerte celular. Con el tiempo, la AG lleva a la pérdida de visión irreversible y ceguera legal. La enfermedad afecta de 5 a 10 millones de personas en todo el mundo, con una prevalencia proyectada a aumentar. Hasta hace poco, no había tratamientos comprobados para la AG, sin embargo, recientemente se han aprobado dos tratamientos por la Administración de Alimentos y Medicamentos de los EE. UU. Estos tratamientos muestran una disminución modesta en la tasa de crecimiento del área de AG, sin beneficio para la agudeza visual. Como tal, muchos ensayos de otras intervenciones están en curso con otros planeados para comenzar en un futuro cercano.

En los ensayos clínicos para AG, un desafío clave radica en identificar pacientes que cumplan con los criterios de inclusión, que exigen imágenes de autofluorescencia de fondo de ojo (FAF), una modalidad que, en contraste con la tomografía de coherencia óptica (OCT), no se obtiene rutinariamente para pacientes con DMAE. Cualquier mecanismo para facilitar estos ensayos, específicamente en torno a los tiempos de reclutamiento, ayudaría a identificar tratamientos eficaces para esta devastadora enfermedad. El reclutamiento tradicional de pacientes a través de búsquedas electrónicas en las Historias Clínicas Digitales (HCDSNS) en notas clínicas es a menudo ineficiente, requiriendo un esfuerzo manual significativo para identificar pacientes con AG antes de validar su diagnóstico con imágenes FAF. Las Historias Clínicas Digitales (HCDSNS) también pueden tener inexactitudes e inconsistencias, especialmente en datos no estructurados, y la AG puede ser frecuentemente subreportada. Cuando se menciona la AG, los registros pueden carecer de detalles suficientes basados en imágenes para cumplir con los estrictos criterios de inclusión del ensayo.

El despliegue de metodologías de inteligencia artificial (IA) podría contribuir a la solución. La IA podría usarse para analizar grandes conjuntos de datos de Historias Clínicas Digitales (HCDSNS) para identificar participantes potenciales con una alta probabilidad de elegibilidad. Podría ser particularmente efectiva en ensayos clínicos con criterios de selección basados en imágenes, como en la AG, con su capacidad para extraer información valiosa de imágenes recopiladas rutinariamente durante la práctica clínica. Usar la IA para ayudar a evaluar imágenes retinianas podría ser un paso clave hacia un enfoque más eficiente para el cribado y, si tiene éxito, podría acortar significativamente los tiempos de reclutamiento en ensayos en curso y futuros.

En este estudio, exploramos el uso de la IA en la identificación de pacientes con AG para facilitar el reclutamiento en ensayos clínicos, como se describe en la Figura 1. Como objetivo principal, comparamos los resultados de un enfoque basado en IA con una búsqueda convencional de Historias Clínicas Digitales (HCDSNS) en la identificación de pacientes con características de imagen requeridas para la inclusión en ensayos clínicos específicos. Como objetivo secundario, estudiamos el acuerdo entre el tamaño de la lesión de AG clasificada por humanos en FAF en comparación con la segmentación de IA en OCT, y la capacidad de filtrar criterios de selección adicionales.

Identificación de pacientes mediante IA

Figura 1.Posible caso de uso de la IA para el reclutamiento de ensayos clínicos en el contexto de la atrofia geográfica. En comparación con los métodos tradicionales de reclutamiento que permiten la identificación de un solo paciente cada vez, la IA puede examinar grandes conjuntos de datos de imágenes retrospectivas y preseleccionar a los pacientes utilizando criterios de imagen específicos del ensayo.

Métodos

Conjunto de datos y participantes

Utilizamos un amplio conjunto de datos retrospectivos del INSIGHT Health Data Research Hub en Moorfields Eye Hospital en Londres, Reino Unido. Este conjunto incluía 306,651 pacientes (602,826 ojos) que acudieron a Moorfields entre el 1 de enero de 2008 y el 10 de abril de 2023 con sospecha de enfermedades retinianas y que se sometieron a imágenes OCT como parte de su evaluación clínica. Un total de 78,917 pacientes (154,410 ojos) permanecieron después de aplicar los criterios de inclusión detallados en el Apéndice Suplementario. La Imagen Suplementaria 2 ilustra la diversidad de condiciones retinianas presentes en este conjunto de datos.

Los datos demográficos, incluyendo edad, sexo (masculino, femenino o desconocido), estado socioeconómico estimado utilizando el índice de privación múltiple, y etnia, se recopilaron cuando fue posible para todos los pacientes. Este estudio fue aprobado por la Autoridad de Investigación en Salud del Reino Unido (referencia: 20/HRA/2158, aprobada el 5 de mayo de 2020). Se renunció al consentimiento informado, dado que nuestro estudio se refiere a datos anónimos retrospectivos. Nuestra investigación se adhiere a los principios éticos descritos en la Declaración de Helsinki.

Visión general del sistema de IA

Utilizamos un sistema de IA capaz de segmentación y clasificación multicategoría, descrito previamente por De Fauw et al., para identificar ojos con AG y excluir ojos con la forma «húmeda» de la enfermedad conocida como neovascularización coroidea (NVC). Aunque la AG tradicionalmente se diagnostica en fotografías del fondo de ojo en color y evaluación clínica, en este estudio, el término ‘AG’ se refiere a la pérdida de epitelio pigmentario de la retina (EPR) con pérdida variable de los fotorreceptores suprayacentes en OCT, como en trabajos anteriores.

En resumen, este sistema de IA procesa escaneos tridimensionales de OCT, segmentando inicialmente características anatómicas a través de una red de segmentación profunda. Estos mapas de tejidos son luego introducidos en una red de clasificación profunda que emite probabilidades de presencia de múltiples patologías maculares concomitantes, incluyendo NVC, AG y drusas (la manifestación temprana de la DMAE). Se aplican a continuación un conjunto de umbrales para transformar estas probabilidades en diagnósticos binarios. Los detalles sobre este particular se suministran en el Apéndice Suplementario.

El modelo fue desarrollado utilizando un conjunto de datos retrospectivos de datos OCT del Moorfields Eye Hospital recopilados entre el 1 de junio de 2012 y el 31 de enero de 2017. No hubo superposición en los datos utilizados para entrenar el sistema de IA y los datos utilizados en el estudio actual. El esquema del modelo se ilustra en la Figura 3.

Figura 3. Descripción general del conjunto de datos, el sistema de IA y la validación clínica. A. De un gran conjunto de datos del Moorfields Eye Hospital de 306.651 pacientes, 78.917 cumplían los criterios de inclusión de nuestra cohorte. La búsqueda en la HCE y el sistema de IA se aplicaron por separado a esta cohorte para identificar una lista de posibles participantes. El sistema de IA se aplicó posteriormente a los pacientes preseleccionados por la búsqueda de HCE para funcionar como un enfoque combinado de IA-HCE. B. Las exploraciones OCT de volumen completo se introducen en la red de segmentación profunda, que genera mapas de segmentación de 15 características anatómicas y patológicas, incluida la capa del epitelio pigmentario de la retina (EPR). A continuación, la red de clasificación profunda utiliza estos mapas de segmentación para predecir las probabilidades de diagnóstico de 10 patologías maculares concomitantes, incluidas drusas, AG y NVC. C. Para estimar el valor predictivo positivo de la lista reducida de participantes producida, se clasificó manualmente un subconjunto utilizando imágenes de OCT y FAF; estas últimas se segmentaron manualmente si había GA. A continuación, se compararon con los resultados de la búsqueda en la HCE y el sistema de IA basado en OCT.Traducción realizada con la versión gratuita del traductor www.DeepL.com/Translator

Figura 3. Descripción general del conjunto de datos, el sistema de IA y la validación clínica. A. De un gran conjunto de datos del Moorfields Eye Hospital de 306.651 pacientes, 78.917 cumplían los criterios de inclusión de nuestra cohorte. La búsqueda en las Historias Clínicas Digitales (HCDSNS) y el sistema de IA se aplicaron por separado a esta cohorte para identificar una lista de posibles participantes. El sistema de IA se aplicó posteriormente a los pacientes preseleccionados por la búsqueda de HCE para funcionar como un enfoque combinado de IA-Historias Clínicas Digitales (HCDSNS). B. Las exploraciones OCT de volumen completo se introducen en la red de segmentación profunda, que genera mapas de segmentación de 15 características anatómicas y patológicas, incluida la capa del epitelio pigmentario de la retina (EPR). A continuación, la red de clasificación profunda utiliza estos mapas de segmentación para predecir las probabilidades de diagnóstico de 10 patologías maculares concomitantes, incluidas drusas, AG y NVC. C. Para estimar el valor predictivo positivo de la lista reducida de participantes producida, se clasificó manualmente un subconjunto utilizando imágenes de OCT y FAF; estas últimas se segmentaron manualmente si había AG. A continuación, se compararon con los resultados de la búsqueda en las Historias Clínicas Digitales (HCDSNS) y el sistema de IA basado en OCT.

Estimación de la IA del área de AG

En ensayos clínicos para AG, la elegibilidad típicamente se determina por un centro de lectura con FAF usado como referencia para medir el área de AG. Siguiendo el primer paso donde confirmamos la presencia de AG y la ausencia de NVC utilizando los resultados de la IA, cuantificamos el área de AG analizando la segmentación de la IA de la capa de EPR producida para cada escaneo de OCT-B. La ausencia de EPR se usó para determinar regiones de AG. El área total de atrofia a través del OCT se sumó entonces en cada escaneo de OCT-B y se convirtió a mm2. Esto se comparó con el rango de área especificado en los criterios del ensayo para determinar si un paciente debía ser preseleccionado.

Ubicación de la AG

Varios criterios del ensayo establecen requisitos sobre la ubicación de la atrofia, específicamente (i) si existe alguna atrofia dentro de 1500 μm desde el centro foveal, que denominamos ‘AG central’, y (ii) si la atrofia se encuentra en el punto central de la fóvea, que denominamos ‘AG involucrando la fóvea’.

Para determinar estos criterios, necesitábamos localizar la fóvea anatómica en el escaneo OCT. Los escaneos OCT de Topcon se fijaron en el locus retiniano preferido, el área de la retina que los individuos naturalmente usan para fijar la vista en un objeto. En ojos con patologías maculares como la AG, esto puede no corresponder con la fóvea anatómica. En su lugar, aproximamos las coordenadas foveales usando la segmentación de la retina neurosensorial (NSR) producida por el sistema de IA. Más detalles de este enfoque están disponibles en el Apéndice Suplementario.

Criterios de ensayos clínicos

Para mostrar nuestro enfoque basado en IA para la preselección de pacientes, seleccionamos criterios relevantes del ensayo HORIZON. HORIZON fue un estudio clínico de fase II que evaluó la seguridad y eficacia de una única inyección subretiniana para pacientes con AG. La elegibilidad se cumplía si un individuo tenía (i) más de 55 años de edad y (ii) un ojo con (iii) AG secundaria a DMAE con un área entre 1.25 y 17.5 mm² inclusive. Estos criterios se usaron para filtrar las salidas de la IA y producir una lista restringida.

Ampliamos nuestros análisis a tres ensayos adicionales con criterios distintos para demostrar completamente las capacidades del sistema de IA. Dos de estos ensayos respaldaron las recientes aprobaciones de la FDA de pegcetacoplan (DERBY) y avacincaptad pegol (GATHER2), y un tercer ensayo de Janssen se encuentra actualmente en curso. Los criterios seleccionados para evaluar el sistema de IA para cada ensayo se enumeran en la Tabla Suplementaria 1.

Búsqueda en Historias Clínicas Digitales (HCDSNS)

Un método común para identificar participantes elegibles para el ensayo es mediante una búsqueda de palabras clave en las Historias Clínicas Digitales (HCDSNS). Los pacientes que asisten al Moorfields Eye Hospital reciben informes clínicos después de cada visita. Realizamos una búsqueda de palabras clave de estos informes para identificar pacientes con la palabra clave «atrofia geográfica» que apareciera en al menos un informe clínico. La fecha más temprana en que apareció la palabra clave en el expediente de un paciente se usó para marcar cualquier exploración de retina posterior.

Además de comparar la precisión del sistema de IA con una búsqueda de palabras clave en las Historias Clínicas Digitales (HCDSNS), evaluamos un método combinado de IA-Historias Clínicas Digitales (HCDSNS). El enfoque comienza con una búsqueda general de las Historias Clínicas Digitales (HCDSNS) para AG, reduciendo la cohorte a pacientes con una mayor probabilidad de ser elegibles. Nuestro sistema de IA se aplica entonces para evaluar a estos pacientes según los criterios de ensayo clínico basados en imágenes descritos anteriormente. El proceso se describe en la Figura 3.

Validación clínica

Validamos los diagnósticos de IA y las mediciones de área frente a las evaluaciones de expertos basadas en criterios del ensayo HORIZON seleccionando aleatoriamente pacientes de tres grupos: (A1) preseleccionados por IA y resultado afirmativo de Historias Clínicas Digitales (HCDSNS); (A2) preseleccionados por IA y resultado negativo de Historias Clínicas Digitales (HCDSNS); (B1) resultado afirmativo de Historias Clínicas Digitales (HCDSNS) pero no preseleccionados por IA. Para que un paciente estuviera disponible para la muestra, debía haber una imagen OCT y una imagen FAF, adquiridas dentro de 90 días antes o después de la OCT, de ambos ojos.

Los expertos calificaron la calidad de la imagen y la presencia de drusas, AG y NVC usando OCT y FAF. La calificación fue realizada por un calificador senior especializado en retina con 10 años de experiencia (R.C.) y un becario de retina médica con 10 años de experiencia clínica (M.J.). Los desacuerdos sobre el diagnóstico fueron arbitrados por un especialista senior en retina con 20 años de experiencia (P.A.K.). Tras la adjudicación, en las imágenes de buena calidad sin NVC pero con AG, los bordes de todas las áreas de autofluorescencia disminuida definida (DDAF) correspondientes a AG en FAF se delinearon manualmente usando ImageJ. El área total de AG segmentada en mm² fue promediada entre los clínicos.

Se utilizaron gráficos de Bland-Altman para evaluar la concordancia entre el área de segmentación de FAF promediada y la segmentación basada en IA de OCT, así como entre las áreas de segmentación de cada calificador. Se calcularon los coeficientes de correlación intraclase (CCI) utilizando el modelo de efectos mixtos de dos vías para el acuerdo. Todos los intervalos de confianza del 95% (IC) se calcularon mediante el muestreo por remuestreo con 10,000 muestras.

Análisis e inferencia

Nuestro objetivo era estimar la proporción de pacientes que realmente serían elegibles para el ensayo, basándonos en los criterios de inclusión por imagen, de todos aquellos que fueron preseleccionados. Después de inferir el valor predictivo positivo (VPP) para la cohorte de pacientes preseleccionados, realizamos una suma ponderada entre los valores apropiados de la validación clínica y el número total de pacientes preseleccionados. Más detalles se pueden encontrar en el Apéndice Suplementario.

Resultados

Datos demográficos de la cohorte

Del conjunto de datos de 78,917 pacientes (154,410 ojos), 1,817 pacientes (2,247 ojos) y 1,729 pacientes (3,381 ojos) fueron preseleccionados por el sistema de IA y la búsqueda en las Historias Clínicas Digitales (HCDSNS), respectivamente. Las características demográficas de los pacientes se describen en la Tabla 2. No hubo diferencias significativas en el estado socioeconómico o el sexo entre los grupos preseleccionados por el sistema de IA y la búsqueda en las Historias Clínicas Digitales (HCDSNS). Ningún grupo étnico estuvo subrepresentado entre los pacientes preseleccionados por el sistema de IA. Notablemente, el sistema de IA seleccionó una proporción mayor de pacientes negros (2.5% vs 1.6%; P = 0.047).

Tabla 2. Datos demográficos de los pacientes. Los datos de edad se calcularon basados en la edad del individuo el 1 de enero de 2023. Los datos de sexo faltaban para 10 individuos en (A). Los datos socioeconómicos faltaban para el 7.3%, 12.2% y 13.0% de los individuos de los conjuntos de datos (A), (B) y (C) respectivamente. Los valores P se obtuvieron mediante remuestreo con 10,000 muestras. Todas las pruebas por pares con (A) devolvieron valores P < 0.001, excepto por ‘Etnia – Otros’, que devolvió valores P de 0.015 y 0.028 con (B) y (C) respectivamente.

Tabla 2.

IA vs búsqueda en las Historias Clínicas Digitales (HCDSNS)

De los 1,729 pacientes preseleccionados por la búsqueda en las Historias Clínicas Digitales (HCDSNS), los cálculos de inferencia basados en la validación clínica estimaron que 693 (40%; IC del 95%: 39–42%) de este grupo cumplirían finalmente los criterios de imagen de HORIZON. De los 1,817 pacientes preseleccionados por el sistema de IA, 1,139 (63%; IC del 95%: 54–71%) de este grupo cumplirían los criterios del ensayo. En comparación con la búsqueda en las Historias Clínicas Digitales (HCDSNS), nuestro sistema de IA logra una mejora absoluta del 23% (P < 0.001) en la proporción de pacientes elegibles encontrados entre los preseleccionados.

Una búsqueda combinada usando el sistema de IA y en las Historias Clínicas Digitales (HCDSNS) juntos preseleccionó 703 candidatos potenciales. De este grupo, las estimaciones mostraron que 604 pacientes (86%; IC del 95%: 79–92%) coincidirían con los criterios de elegibilidad, resultando en una mejora absoluta del 46% sobre la búsqueda solo en las Historias Clínicas Digitales (HCDSNS) (P < 0.001). Estos resultados se detallan en la Tabla Suplementaria 3.

Ampliación a otros ensayos clínicos

Más allá de cumplir con los criterios de imagen para el ensayo HORIZON, el sistema de IA es capaz de ajustarse a criterios adicionales en varios otros ensayos clínicos de AG. Las diferencias incluyen rangos de edad permitidos, hasta qué punto se considera excluyente la NVC en el ojo de estudio o en el ojo contralateral, los límites permitidos del área de AG, y si los pacientes son elegibles basados en la ubicación de la AG en relación con la fóvea. Un resumen de cada criterio de elegibilidad, así como el número de pacientes que el sistema de IA preseleccionó para cada ensayo, se puede encontrar en la Tabla Suplementaria 1. En comparación con los 1,817 pacientes preseleccionados para el ensayo HORIZON, nuestro sistema de IA preselecciona 1,580 pacientes para DERBY, 768 para el ensayo de Janssen, y 438 para GATHER2. Presentamos ejemplos de segmentaciones de IA para pacientes que fueron preseleccionados para cada ensayo en la Figura 4.

Figura 4: Ejemplos de la segmentación por IA de OCT y la segmentación clínica de FAF. Cada subtrama contiene la imagen OCT en la cara con la segmentación de IA (arriba) y la imagen FAF asociada del mismo ojo con la segmentación del evaluador R.C (abajo). La ubicación de la fóvea determinada por IA (más blanco) y un círculo de 1500 μm centrado en la fóvea (círculo rojo) están indicados. Las estimaciones de área de AG de IA y humanos promediadas también se indican, así como los ensayos clínicos para los cuales cada individuo es elegible basado en los resultados de IA (considerando las salidas para ambos ojos cuando sea necesario). (a) Este paciente es únicamente elegible para HORIZON ya que el AAI está por debajo del límite inferior para los otros ensayos (2.5 mm²). Los pacientes en (b) y (c) tienen AG central y no involucran la fóvea, pero la CNV en sus ojos compañeros los excluye de los ensayos GATHER2 y Janssen. El paciente en (d) fue determinado por la IA como apto para los criterios de imagen de todos los ensayos.

Figura 4: Ejemplos de la segmentación por IA de OCT y la segmentación clínica de FAF. Cada subtrama contiene la imagen OCT en la cara con la segmentación de IA (arriba) y la imagen FAF asociada del mismo ojo con la segmentación del evaluador R.C (abajo). La ubicación de la fóvea determinada por IA (más blanco) y un círculo de 1500 μm centrado en la fóvea (círculo rojo) están indicados. Las estimaciones de área de AG de IA y humanos promediadas también se indican, así como los ensayos clínicos para los cuales cada individuo es elegible basado en los resultados de IA (considerando las salidas para ambos ojos cuando sea necesario). (a) Este paciente es únicamente elegible para HORIZON ya que el AAI está por debajo del límite inferior para los otros ensayos (2.5 mm²). Los pacientes en (b) y (c) tienen AG central y no involucran la fóvea, pero la NVC en los ojos contralaterales los excluye de los ensayos GATHER2 y Janssen. El paciente en (d) fue determinado por la IA como apto para los criterios de imagen de todos los ensayos.

 

Validación clínica del sistema de IA

La precisión en predecir la elegibilidad para ensayos clínicos fue evaluada usando los valores de VPP y NPV derivados de la validación clínica (Tabla 4). Usando la evaluación humana como referencia estándar, el sistema de IA preselecciona pacientes con un VPP del 86% (IC del 95%: 79–92%) cuando «atrofia geográfica» estaba presente en las Historias Clínicas Digitales (HCDSNS) y 48% (IC del 95%: 38–57%) cuando estaba ausente. Solo el 9% (IC del 95%: 3–16%) de los pacientes con una búsqueda afirmativa en las Historias Clínicas Digitales (HCDSNS) pero no preseleccionados por la IA resultaron ser elegibles. Como se describe más adelante en el Apéndice Suplementario, estos resultados se utilizaron para calcular los rendimientos en el proceso de inferencia anterior.

Tabla 4: Resultados de la validación clínica. Cada estrato se definió por si un paciente tenía un resultado afirmativo en las Historias Clínicas Digitales (HCDSNS) en una visita antes del escaneo incluido, y si el sistema de IA determina que al menos uno de los ojos de un paciente es elegible basado en los criterios del ensayo HORIZON. Los pacientes se dividieron en uno de estos tres estratos según sus escaneos oculares más recientes y luego se muestrearon aleatoriamente para formar los conjuntos de datos de validación clínica.

 

Número de pacientes elegibles (1) Historias Clínicas Digitales (HCDSNS) contiene ‘atrofia geográfica’ (2) Historias Clínicas Digitales (HCDSNS) no contiene ‘atrofia geográfica’
(A) IA preseleccionada 84 / 98 VPP: 86% (IC del 95%: 79–92%) 36 / 75 VPP: 48% (IC del 95%: 38–57%)
(B) IA no preseleccionada 7 / 81    VPP: 9% (IC del 95%: 3–16%)

La concordancia entre el área derivada por IA y el área segmentada por los evaluadores promediada se ilustra en la Figura Suplementaria 5. Al comparar el área de AG, se mostró una diferencia media de 0.70 mm² (IC del 95%: -6.08–7.47 mm²), con un coeficiente de correlación intraclase (CCI) de 0.70 (IC del 95%: 0.61–0.78). Restringiendo el análisis al rango de área elegible, se mostró una diferencia media de 0.27 mm² (IC del 95%: -5.21–5.75 mm²), con un CCI de 0.77 (IC del 95%: 0.68–0.84). Los gráficos de Bland-Altman inter-evaluadores también se pueden encontrar en la Figura Suplementaria 5. Al comparar el área de AG, se mostró una diferencia media de -0.41 mm² (IC del 95%: -5.65–4.82 mm²), con un CCI de 0.92 (IC del 95%: 0.89–0.94). Restringiendo el análisis a los puntos de datos elegibles, se mostró una diferencia media de -0.15 mm² (IC del 95%: -2.32–2.02 mm²), con un CCI de 0.97 (IC del 95%: 0.95–0.98).

El área media de AG de aquellos preseleccionados por la IA fue de 8.56 mm² (IC del 95%: 8.22–8.96 mm²) (Figura Suplementaria 6). El subconjunto con una búsqueda afirmativa Historias Clínicas Digitales (HCDSNS) tuvo un área media de AG de 10.1 mm² (IC del 95%: 9.36–10.6 mm²), mientras que aquellos sin la búsqueda Historias Clínicas Digitales (HCDSNS) tuvieron un área media de 7.52 mm² (IC del 95%: 6.95–8.02 mm²).

Discusión

La degeneración macular relacionada con la edad (DMAE) sigue siendo una causa común de mala visión en las personas mayores, con una intensa actividad de investigación dirigida a ralentizar la muerte celular en las etapas avanzadas de la atrofia geográfica (AG) con tratamientos novedosos. En este estudio, demostramos que la inteligencia artificial (IA) puede examinar grandes cantidades de datos diversos del mundo real para identificar candidatos que cumplan criterios específicos de selección basados en imágenes para ensayos de AG. El sistema de IA también cuantifica con precisión el área de AG utilizando escaneos OCT, mostrando un buen acuerdo con las imágenes de autofluorescencia de fondo de ojo (FAF) evaluadas por expertos.

Las estrategias convencionales de búsqueda en registros electrónicos de salud (EHR) que dependen de informes clínicos pueden pasar por alto a pacientes con AG presente en las imágenes, cuyo diagnóstico no está explícitamente registrado por su oftalmólogo. También pueden capturar a pacientes con AG documentada en sus informes que posteriormente no cumplen con los rigurosos criterios basados en imágenes para la elegibilidad del ensayo. En nuestro estudio, este método produjo una tasa de elegibilidad del 40%. Usando nuestro algoritmo de IA solo, la tasa de elegibilidad aumenta a 63%. Cuando se combina con la búsqueda en EHR, esta aumenta aún más a 87%, lo que significa que nuestro enfoque basado en IA reduce significativamente la probabilidad de que un individuo experimente un fracaso en el cribado basado en imágenes. Nuestro enfoque tiene la capacidad de agilizar el proceso de preselección de pacientes, ofreciendo una alternativa más eficiente y precisa a una búsqueda en EHR tradicional, así como permitiendo que las clínicas sin sistemas EHR sofisticados se beneficien de la preselección automatizada.

De una cohorte inicial de casi 80,000 pacientes, utilizando el enfoque combinado de IA-EHR, identificamos a más de 600 pacientes con una alta probabilidad de elegibilidad por imagen para el ensayo HORIZON. Nuestro sistema de IA también puede ajustarse para cumplir con criterios específicos basados en imágenes de otros ensayos de AG, como la ubicación de la AG (central o foveal) y la presencia de CNV. Esto nos permitió producir listas cortas personalizadas de pacientes para los ensayos DERBY/OAKS, GATHER2 y Janssen. Al aplicar con criterios preestablecidos, nuestro enfoque permite a los patrocinadores de ensayos evaluar la factibilidad del sitio al estimar cifras de inscripción de pacientes basadas en los recursos disponibles para la evaluación y la prevalencia de la enfermedad, facilitando así un enfoque basado en datos para el diseño del protocolo.

El modelo de IA estima el tamaño de la AG evaluando el área de pérdida de EPR. Descubrimos que había un buen acuerdo en la comparación entre modalidades (FAF/OCT) entre la IA y los evaluadores humanos. A pesar de ser inferior en comparación con el acuerdo inter-evaluador en la misma modalidad, los resultados de la IA alcanzan un CCI en el rango de estudios previos que examinan la segmentación automática de escaneos OCT como un sustituto para la FAF evaluada manualmente. Una limitación inherente con este enfoque es que las imágenes FAF y OCT tienen diferencias fundamentales que pueden llevar a la IA a sobreestimar o subestimar el área total de AG. FAF proporciona información sobre el estado tanto del EPR como de los fotoreceptores sin la capacidad de evaluar cada estructura individualmente. Cuando los evaluadores humanos miden el área de DDAF en FAF, es posible que no refleje el estado real del EPR solo. En contraste, el OCT es resuelto en profundidad y evalúa específicamente la pérdida de EPR. Descubrimos que la IA tendía a subestimar el área total de AG para lesiones mayores de 17.5 mm² en FAF, especialmente cuando se extendían más allá del campo de visión de OCT. La coincidencia entre cada par de FAF y OCT podría ayudar a mitigar esto. También se observaron sobreestimaciones, potencialmente causadas por errores en la segmentación de EPR, como alrededor del nervio óptico debido a la atrofia peripapilar.

El reclutamiento de minorías en ensayos de DMAE ha sido históricamente un obstáculo significativo. Nuestro sistema tiene la capacidad de mejorar la diversidad en el reclutamiento de ensayos. Al ser basado en imágenes, es a priori agnóstico respecto al sexo y la etnia. Específicamente, nuestro diseño de modelo reduce la posibilidad de codificar sesgos implícitos mediante el uso de mapas de segmentación como entrada para el modelo de clasificación en lugar de un escaneo OCT en bruto. Estos mapas pueden contener menos marcadores de identidad en comparación con las intensidades de píxeles de OCT, aunque se requieren más investigaciones para confirmar esto. No obstante, nuestro sistema de IA preseleccionó proporciones similares de pacientes por sexo y estado socioeconómico en comparación con la búsqueda en EHR, mientras que destacó significativamente más pacientes negros. Estos hallazgos prometedores sugieren que el sistema de IA evita perpetuar sesgos contra las minorías subrepresentadas en nuestro entorno.

En conclusión, demostramos que una herramienta de IA puede facilitar el reclutamiento en ensayos clínicos en DMAE. Dada la intensa actividad de ensayos clínicos actualmente en curso, creemos que la implementación de esta estrategia impulsada por IA ofrecerá una solución escalable a los desafíos de reclutamiento en ensayos de AG. Nuestros esfuerzos futuros se concentrarán en evaluar la robustez del mundo real de esta solución de IA, asegurando que se desempeñe bien con imágenes recopiladas rutinariamente de calidad variable, protocolos, equipos y en poblaciones diversas.

Contribuciones:

DJW, RRS, NT, BT, RC y PAK conceptualizaron el estudio y diseñaron los experimentos. PAK obtuvo la financiación. MAC, SKW y RC generaron el conjunto de datos utilizado en el estudio. DJW y RRS escribieron el código y llevaron a cabo los experimentos. MJ y RC calificaron las imágenes de autofluorescencia de fondo. FA y DJW redactaron el manuscrito inicial y diseñaron las figuras. ZW, RG y SSK proporcionaron una revisión crítica del manuscrito por su contenido intelectual importante. Todos los autores revisaron y discutieron los resultados. Todos los autores editaron y revisaron el manuscrito antes de aprobar la versión final de este manuscrito.

Resumen

Este estudio ilustra el potencial de la inteligencia artificial para mejorar el reclutamiento en ensayos clínicos para la atrofia geográfica mediante el análisis profundo de escaneos de tomografía de coherencia óptica, identificando pacientes elegibles según criterios de imagen específicos del ensayo.

Traducción: Asociación Mácula Retina
Fuente