La importancia de la estimación de la incertidumbre en la Inteligencia Artificial para negocios.
El valor social y económico que nos trae la Inteligencia Artificial(IA) es innegable. Desde la publicidad en internet, a la asistencia en el desarrollo de la vacuna de Covid-19. Actualmente existe un boom en la adopción de la IA en industrias tradicionales como finanzas y la banca, donde la IA es usada para evaluar préstamos, luchar contra el lavado de dinero así como la prevención de transacciones fraudulentas. Otras aplicaciones emergentes donde la IA se está incrementado es en los equipos médicos de diagnóstico, así como los sistemas de navegación en carros autónomos.
A medida que la IA va permeando en áreas donde las decisiones son de alto riesgo, como las ciencias de la vida y el sector financiero, más cuidado debe tomarse en el diseño e implementación de modelos de IA. Los siguientes son un par de ejemplos donde la medición de la incertidumbre de nuestros modelos es de vital importancia.
- ¿Debería prescribir el siguiente tratamiento médico?
- ¿El piloto automático del auto debe acelerar o no?
Primero necesitamos definir ¿qué es la “incertidumbre”? en el contexto de IA-Aprendizaje automático (machine learning). Incertidumbre se refiere a las situaciones donde no hay conocimiento perfecto de la información acerca del fenómeno en cuestión, sino cierto grado de desconocimiento (como en la mayoría de los negocios). En términos prácticos, medir la incertidumbre significa qué tanto confiamos en los resultados de nuestros modelos de IA. El aprendizaje automático probabilístico es un campo de la IA que nos permite calcular la incertidumbre.
¿Cómo funciona en la práctica?
Pensemos en el caso de un comercio que necesita planear su inventario para el siguiente cuatrimestre con un presupuesto limitado. Es crítico tener un pronóstico acertado de las ventas esperadas para poder hacer una alocación del inventario adecuada. Los modelos de IA tradicional nos dicen: “las ventas esperadas del producto X para el próximo cuatrimestre son 126”. En contraste el IA-aprendizaje automático probabilístico te dirá tu rango de ventas probables: “puedes vender entre 115 y 135 unidades del producto X”. En concreto podemos decir que un modelo no probabilístico o tradicional nos dirá un pronóstico de un único valor futuro en ventas, pero el IA-probabilístico nos dará una distribución de probabilidad de venta, siendo la mediana de la distribución de las ventas equivalente al resultado de la IA no probabilística. Teniendo una distribución probabilística podemos tomar mejores y más acertadas decisiones, por ejemplo, los intervalos de confianza de la distribución pueden ayudar a estimar cual sería la potencial venta maxima (o minima) el próximo cuatrimestre. Esto abre la puerta a la toma de decisiones basada en simulación usando IA, pudiéndose agregar más información para enriquecer el sistema como tiempos de entrega, descuentos, promociones, etc. Además nos ayuda a identificar los riesgos potenciales de nuestro negocio e incrementar la rentabilidad.
La incertidumbre proviene tanto del modelo de IA como de los datos (aleatoria y epistémica). En la práctica, medir la incertidumbre nos ayuda a mejorar nuestro modelo y a usar menos datos. El aprendizaje automático probabilístico utiliza el teorema de Bayes, construir un modelo con este teorema permite elaborar una probabilidad a “priori”, esto nos permite incorporar nuestro propio conocimiento (experiencia) del problema para que ayude al aprendizaje de nuestro modelo. La eficiencia en datos no está directamente relacionada a la medición de la incertidumbre, pero una alta incertidumbre en el modelo puede darnos más claridad sobre la cantidad y/o calidad de nuestros datos. Ser eficiente con los datos es clave para la aplicación de IA en negocios, donde los datos a veces se pierden o tenemos datos incompletos sobre un cliente o mercado en particular.
¿Por qué el aprendizaje automático probabilístico no es comúnmente usado?
Los beneficios de contar con incertidumbre y buenos resultados no son gratis. La maquinaria del aprendizaje automático probabilístico es computacionalmente más intensivo, pero avances recientes tanto en algoritmos como hardware, nos han permitido desarrollar modelos de manera más eficiente que resuelven problemas de negocios a gran escala. Diariamente corremos modelos que hace unos años eran impensables, incluso en una laptop, aunque siempre será más eficiente y conveniente utilizar instancias de cómputo en la nube que utilizan múltiples nodos de CPU/GPU.
Dar a las máquinas la capacidad de medir la incertidumbre, las acerca más a la forma en la que los humanos tomamos decisiones. Cuando nosotros dudamos en tomar una decisión en donde no tenemos suficiente información, el sentimiento de incertidumbre nos hace buscar más datos, o mejorar nuestro proceso de decisión. La estimación de la incertidumbre es necesaria en las aplicaciones de IA, donde el costo de tomar la decisión incorrecta es alto. En los próximos años veremos más aplicaciones industriales del aprendizaje automático probabilístico que nos ayudarán a estar más cerca de la verdadera IA.