16 KiB
Posdata: Aprendizaje automático en el mundo real
Sketchnote por Tomomi Imura
En este plan de estudios, has aprendido muchas formas de preparar datos para el entrenamiento y crear modelos de aprendizaje automático. Construiste una serie de modelos clásicos de regresión, agrupamiento, clasificación, procesamiento de lenguaje natural y series temporales. ¡Felicidades! Ahora, podrías estar preguntándote para qué sirve todo esto... ¿cuáles son las aplicaciones reales de estos modelos?
Aunque la inteligencia artificial (IA), que generalmente utiliza aprendizaje profundo, ha captado mucho interés en la industria, todavía hay aplicaciones valiosas para los modelos clásicos de aprendizaje automático. ¡Incluso podrías estar usando algunas de estas aplicaciones hoy en día! En esta lección, explorarás cómo ocho industrias y dominios temáticos diferentes utilizan estos tipos de modelos para hacer que sus aplicaciones sean más eficientes, confiables, inteligentes y valiosas para los usuarios.
Cuestionario previo a la lección
💰 Finanzas
El sector financiero ofrece muchas oportunidades para el aprendizaje automático. Muchos problemas en esta área se prestan a ser modelados y resueltos utilizando ML.
Detección de fraude con tarjetas de crédito
Aprendimos sobre agrupamiento k-means anteriormente en el curso, pero ¿cómo puede usarse para resolver problemas relacionados con el fraude con tarjetas de crédito?
El agrupamiento k-means es útil en una técnica de detección de fraude con tarjetas de crédito llamada detección de valores atípicos. Los valores atípicos, o desviaciones en las observaciones de un conjunto de datos, pueden indicarnos si una tarjeta de crédito se está utilizando de manera normal o si algo inusual está ocurriendo. Como se muestra en el artículo enlazado a continuación, puedes clasificar los datos de tarjetas de crédito utilizando un algoritmo de agrupamiento k-means y asignar cada transacción a un grupo según qué tan atípica parezca ser. Luego, puedes evaluar los grupos más riesgosos para determinar transacciones fraudulentas frente a legítimas.
Referencia
Gestión de patrimonios
En la gestión de patrimonios, una persona o empresa maneja inversiones en nombre de sus clientes. Su trabajo es mantener y hacer crecer la riqueza a largo plazo, por lo que es esencial elegir inversiones que tengan un buen desempeño.
Una forma de evaluar cómo se desempeña una inversión en particular es a través de la regresión estadística. La regresión lineal es una herramienta valiosa para entender cómo se desempeña un fondo en relación con un punto de referencia. También podemos deducir si los resultados de la regresión son estadísticamente significativos o cuánto afectarían las inversiones de un cliente. Incluso podrías ampliar tu análisis utilizando regresión múltiple, donde se pueden tener en cuenta factores de riesgo adicionales. Para un ejemplo de cómo funcionaría esto para un fondo específico, consulta el artículo a continuación sobre la evaluación del desempeño de fondos utilizando regresión.
Referencia
🎓 Educación
El sector educativo también es un área muy interesante donde se puede aplicar ML. Hay problemas fascinantes por resolver, como detectar trampas en exámenes o ensayos, o gestionar sesgos, intencionados o no, en el proceso de corrección.
Predicción del comportamiento estudiantil
Coursera, un proveedor de cursos abiertos en línea, tiene un excelente blog técnico donde discuten muchas decisiones de ingeniería. En este estudio de caso, trazaron una línea de regresión para explorar cualquier correlación entre una baja calificación de NPS (Net Promoter Score) y la retención o abandono de cursos.
Referencia
Mitigación de sesgos
Grammarly, un asistente de escritura que revisa errores ortográficos y gramaticales, utiliza sofisticados sistemas de procesamiento de lenguaje natural en todos sus productos. Publicaron un interesante estudio de caso en su blog técnico sobre cómo abordaron el sesgo de género en el aprendizaje automático, algo que aprendiste en nuestra lección introductoria sobre equidad.
Referencia
👜 Comercio minorista
El sector minorista puede beneficiarse enormemente del uso de ML, desde crear una mejor experiencia para el cliente hasta optimizar el inventario.
Personalización del recorrido del cliente
En Wayfair, una empresa que vende artículos para el hogar como muebles, ayudar a los clientes a encontrar los productos adecuados para sus gustos y necesidades es fundamental. En este artículo, los ingenieros de la empresa describen cómo utilizan ML y NLP para "mostrar los resultados correctos a los clientes". En particular, su motor de intención de consulta se ha construido para usar extracción de entidades, entrenamiento de clasificadores, extracción de opiniones y etiquetado de sentimientos en las reseñas de los clientes. Este es un caso clásico de cómo funciona el NLP en el comercio minorista en línea.
Referencia
Gestión de inventarios
Empresas innovadoras y ágiles como StitchFix, un servicio de cajas que envía ropa a los consumidores, dependen en gran medida de ML para recomendaciones y gestión de inventarios. Sus equipos de estilismo trabajan junto con sus equipos de comercialización: "uno de nuestros científicos de datos experimentó con un algoritmo genético y lo aplicó a prendas para predecir qué sería una pieza de ropa exitosa que aún no existe. Llevamos eso al equipo de comercialización y ahora pueden usarlo como una herramienta".
Referencia
🏥 Salud
El sector de la salud puede aprovechar ML para optimizar tareas de investigación y también problemas logísticos como la readmisión de pacientes o la prevención de la propagación de enfermedades.
Gestión de ensayos clínicos
La toxicidad en los ensayos clínicos es una gran preocupación para los fabricantes de medicamentos. ¿Cuánta toxicidad es tolerable? En este estudio, el análisis de varios métodos de ensayos clínicos llevó al desarrollo de un nuevo enfoque para predecir las probabilidades de los resultados de los ensayos clínicos. Específicamente, pudieron usar random forest para producir un clasificador capaz de distinguir entre grupos de medicamentos.
Referencia
Gestión de readmisiones hospitalarias
La atención hospitalaria es costosa, especialmente cuando los pacientes deben ser readmitidos. Este artículo analiza una empresa que utiliza ML para predecir el potencial de readmisión utilizando algoritmos de agrupamiento. Estos grupos ayudan a los analistas a "descubrir grupos de readmisiones que pueden compartir una causa común".
Referencia
Gestión de enfermedades
La reciente pandemia ha puesto de relieve cómo el aprendizaje automático puede ayudar a detener la propagación de enfermedades. En este artículo, reconocerás el uso de ARIMA, curvas logísticas, regresión lineal y SARIMA. "Este trabajo es un intento de calcular la tasa de propagación de este virus y, por lo tanto, predecir las muertes, recuperaciones y casos confirmados, para que podamos prepararnos mejor y sobrevivir".
Referencia
🌲 Ecología y tecnología verde
La naturaleza y la ecología consisten en muchos sistemas sensibles donde la interacción entre animales y la naturaleza es clave. Es importante medir estos sistemas con precisión y actuar adecuadamente si ocurre algo, como un incendio forestal o una disminución en la población animal.
Gestión forestal
Aprendiste sobre aprendizaje por refuerzo en lecciones anteriores. Puede ser muy útil al intentar predecir patrones en la naturaleza. En particular, puede usarse para rastrear problemas ecológicos como incendios forestales y la propagación de especies invasoras. En Canadá, un grupo de investigadores utilizó aprendizaje por refuerzo para construir modelos de dinámica de incendios forestales a partir de imágenes satelitales. Usando un innovador "proceso de propagación espacial (SSP)", imaginaron un incendio forestal como "el agente en cualquier celda del paisaje". "El conjunto de acciones que el fuego puede tomar desde una ubicación en cualquier momento incluye propagarse al norte, sur, este u oeste o no propagarse".
Referencia
Detección de movimiento de animales
Aunque el aprendizaje profundo ha revolucionado el seguimiento visual de movimientos de animales (puedes construir tu propio rastreador de osos polares aquí), el ML clásico todavía tiene un lugar en esta tarea.
Los sensores para rastrear movimientos de animales de granja e IoT hacen uso de este tipo de procesamiento visual, pero las técnicas más básicas de ML son útiles para preprocesar datos. Por ejemplo, en este artículo, se monitorearon y analizaron posturas de ovejas utilizando varios algoritmos clasificadores. Podrías reconocer la curva ROC en la página 335.
Referencia
⚡️ Gestión de energía
En nuestras lecciones sobre pronóstico de series temporales, invocamos el concepto de parquímetros inteligentes para generar ingresos para una ciudad basándonos en la comprensión de la oferta y la demanda. Este artículo analiza en detalle cómo el agrupamiento, la regresión y el pronóstico de series temporales se combinaron para ayudar a predecir el uso futuro de energía en Irlanda, basado en medidores inteligentes.
Referencia
💼 Seguros
El sector de seguros es otro sector que utiliza ML para construir y optimizar modelos financieros y actuariales viables.
Gestión de volatilidad
MetLife, un proveedor de seguros de vida, es transparente sobre cómo analizan y mitigan la volatilidad en sus modelos financieros. En este artículo notarás visualizaciones de clasificación binaria y ordinal. También descubrirás visualizaciones de pronósticos.
Referencia
🎨 Artes, cultura y literatura
En las artes, por ejemplo en el periodismo, hay muchos problemas interesantes. Detectar noticias falsas es un gran desafío, ya que se ha demostrado que influyen en la opinión de las personas e incluso pueden desestabilizar democracias. Los museos también pueden beneficiarse del uso de ML en todo, desde encontrar vínculos entre artefactos hasta la planificación de recursos.
Detección de noticias falsas
Detectar noticias falsas se ha convertido en un juego del gato y el ratón en los medios de comunicación actuales. En este artículo, los investigadores sugieren que un sistema que combine varias de las técnicas de ML que hemos estudiado puede probarse y desplegarse el mejor modelo: "Este sistema se basa en el procesamiento de lenguaje natural para extraer características de los datos y luego estas características se utilizan para entrenar clasificadores de aprendizaje automático como Naive Bayes, Support Vector Machine (SVM), Random Forest (RF), Stochastic Gradient Descent (SGD) y Logistic Regression (LR)".
Referencia
Este artículo muestra cómo combinar diferentes dominios de ML puede producir resultados interesantes que ayuden a detener la propagación de noticias falsas y evitar daños reales; en este caso, el impulso fue la propagación de rumores sobre tratamientos para el COVID que incitaron a la violencia.
ML en museos
Los museos están al borde de una revolución de IA en la que catalogar y digitalizar colecciones y encontrar vínculos entre artefactos se está volviendo más fácil a medida que avanza la tecnología. Proyectos como In Codice Ratio están ayudando a desbloquear los misterios de colecciones inaccesibles como los Archivos Vaticanos. Pero el aspecto comercial de los museos también se beneficia de los modelos de ML.
Por ejemplo, el Instituto de Arte de Chicago construyó modelos para predecir qué interesa a las audiencias y cuándo asistirán a exposiciones. El objetivo es crear experiencias de visitante individualizadas y optimizadas cada vez que el usuario visite el museo. "Durante el año fiscal 2017, el modelo predijo la asistencia y las admisiones con un 1% de precisión, dice Andrew Simnick, vicepresidente senior del Instituto de Arte".
Referencia
🏷 Marketing
Segmentación de clientes
Las estrategias de marketing más efectivas apuntan a los clientes de diferentes maneras según varios grupos. En este artículo, se discuten los usos de los algoritmos de agrupamiento para apoyar el marketing diferenciado. El marketing diferenciado ayuda a las empresas a mejorar el reconocimiento de marca, llegar a más clientes y ganar más dinero.
Referencia
🚀 Desafío
Identifica otro sector que se beneficie de algunas de las técnicas que aprendiste en este plan de estudios y descubre cómo utiliza ML.
Cuestionario posterior a la clase
Revisión y Autoestudio
El equipo de ciencia de datos de Wayfair tiene varios videos interesantes sobre cómo utilizan el aprendizaje automático en su empresa. Vale la pena echarles un vistazo.
Tarea
Una búsqueda del tesoro de aprendizaje automático
Descargo de responsabilidad:
Este documento ha sido traducido utilizando el servicio de traducción automática Co-op Translator. Si bien nos esforzamos por lograr precisión, tenga en cuenta que las traducciones automáticas pueden contener errores o imprecisiones. El documento original en su idioma nativo debe considerarse como la fuente autorizada. Para información crítica, se recomienda una traducción profesional realizada por humanos. No nos hacemos responsables de malentendidos o interpretaciones erróneas que puedan surgir del uso de esta traducción.