Alfredo Quiros, gerente regional de AZmed para Iberia, Latinoamérica y Portugal, explica qué problema buscan resolver las herramientas de apoyo al diagnóstico, cómo se integran al flujo de trabajo y qué significan métricas como sensibilidad, especificidad y valor predictivo negativo en la práctica.
Dr. Flavio Sánchez:
Para entender cómo se aplica la inteligencia artificial en radiología convencional, ¿cómo es el proceso? ¿Cómo pasa una imagen de ser analizada a generar una segunda lectura o una orientación diagnóstica?
Alfredo Quiros:
Partimos de una problemática concreta: La radiología convencional perdió, en muchos contextos, el nivel de especialización y acompañamiento que tenía antes.
Hoy, en muchos servicios, los estudios son evaluados por médicos de guardia, de atención primaria o de familia, que no siempre cuentan con el respaldo inmediato de un radiólogo.
En un contexto de creciente volumen de estudios, eso genera errores diagnósticos, demoras y más interconsultas.
Ahí es donde intervenimos. Desarrollamos herramientas de apoyo al diagnóstico que analizan fracturas, patologías torácicas y otras condiciones, y que funcionan como una segunda lectura dentro del flujo de trabajo.
Nos integramos al sistema PACS y dejamos esa información disponible directamente en el visor. La idea es sumar una capa de análisis que ayude a tomar decisiones más rápido y con mayor seguridad.
Dr. Flavio Sánchez:
Es decir, no solo es una herramienta para el radiólogo, sino también para otros profesionales que interpretan imágenes en su práctica diaria. Y funciona como una segunda lectura, no como un reemplazo.
En ese contexto, muchos sistemas hablan de métricas como valor predictivo negativo, sensibilidad o especificidad. ¿Cómo se traducen esos conceptos en la práctica?
Alfredo Quiros:
Son tres métricas clave.
El valor predictivo negativo indica qué tan confiable es la herramienta cuando dice que no hay patología. En nuestro caso, supera el 99%. Eso significa que, cuando el sistema marca un estudio como normal, el profesional puede confiar en ese resultado.
La sensibilidad mide la capacidad de detectar una patología cuando está presente. También está en torno al 99%, lo que implica que es muy poco probable que una patología pase desapercibida.
La especificidad indica cuántas veces acertamos cuando señalamos que hay una patología. En ese caso, estamos alrededor del 90%.
Esto tiene una explicación: no es posible maximizar todas las métricas al mismo tiempo. Por eso priorizamos el valor predictivo negativo, para poder descartar rápidamente los estudios normales y organizar mejor el flujo de trabajo.
Dado que entre el 60% y el 80% de las radiografías son normales, eso permite enfocarse en los casos positivos, donde además señalamos la posible zona patológica para facilitar la lectura.
Puede haber falsos positivos, pero se presentan como niveles de sospecha. El objetivo es no dejar pasar patología y acelerar el proceso diagnóstico.
Alfredo Quiros:
En la práctica, esto impacta en todos los perfiles. El radiólogo trabaja más rápido. El médico de urgencias o de atención primaria cuenta con una segunda lectura para decidir cuándo escalar el caso. Y el especialista recibe una orientación más clara para avanzar.
Son herramientas de apoyo. No reemplazan al profesional. De hecho, están certificadas como dispositivos de clase 2a, lo que implica que siempre requieren validación médica. Una forma simple de pensarlo es como Google Maps: no es infalible, pero mejora significativamente la forma en que nos movemos.
Dr. Flavio Sánchez:
En relación a la validación, ¿cuál es el gold standard detrás de estos sistemas? ¿Cómo se entrenan?
Alfredo Quiros:
El sistema se entrena con un modelo semisupervisado y un dataset de más de 15 millones de imágenes.
Para asegurar calidad, utilizamos un esquema de gold standard con tres radiólogos: dos trabajan en doble ciego y un tercero valida. Ese proceso permite generar datos confiables para entrenar el algoritmo en distintas patologías, equipos y condiciones de estudio.
Es importante aclarar que no utilizamos datos de los hospitales donde estamos implementados. El entrenamiento se realiza en paralelo, con datasets propios. A medida que el algoritmo mejora, se actualiza como cualquier software. Nuestra herramienta principal ya va por su séptima versión.
Dr. Flavio Sánchez:
Es una aclaración importante, porque suele haber dudas sobre el uso de datos. Muchas gracias.
Esta es la primera parte de la entrevista con Alfredo Quiros. En la próxima entrega, profundizaremos sobre el impacto real de la inteligencia artificial en los tiempos de diagnóstico, la calidad del informe y los criterios para elegir una herramienta confiable.