Ir al contenido

MLOps

De Wikipedia, la enciclopedia libre
MLOps es el conjunto de prácticas en la intersección de aprendizaje automático, DevOps e ingeniería de datos[1]

MLOps o ML Ops es un paradigma que tiene como objetivo implementar y mantener modelos de aprendizaje automático en producción de manera confiable y eficiente.[1]​ La palabra es una combinación de "aprendizaje automático" (en inglés machine learning) y la práctica de entrega continua de DevOps en el campo del software. Los modelos de aprendizaje automático se prueban y desarrollan en sistemas experimentales aislados. Cuando un algoritmo está listo para ser lanzado, se practican MLOps entre científicos de datos, DevOps e ingenieros de aprendizaje automático para realizar la transición del algoritmo a los sistemas de producción.[2]​ De manera similar a los enfoques DevOps o DataOps, MLOps busca aumentar la automatización y mejorar la calidad de los modelos de producción, al mismo tiempo que se centra en los requisitos regulatorios y comerciales.

Si bien MLOps comenzó como un conjunto de mejores prácticas, está evolucionando lentamente hacia un enfoque independiente para la gestión del ciclo de vida del ML. MLOps se aplica a todo el ciclo de vida, desde la integración con la generación de modelos (ciclo de vida de desarrollo de software, integración continua / entrega continua), la orquestación y la implementación, hasta el estado, el diagnóstico, la gobernanza y las métricas comerciales. Según Gartner, MLOps es un subconjunto de ModelOps. MLOps se centra en la operacionalización de modelos ML, mientras que ModelOps cubre la operacionalización de todo tipo de modelos de IA.[3]

Definición[editar]

MLOps es un paradigma, que incluye aspectos como mejores prácticas, conjuntos de conceptos, así como una cultura de desarrollo cuando se trata de la conceptualización, implementación, monitoreo, despliegue y escalabilidad de un extremo a otro de productos de aprendizaje automático. Sobre todo, es una práctica de ingeniería que aprovecha tres disciplinas contribuyentes: aprendizaje automático, ingeniería de software (especialmente DevOps) e ingeniería de datos. MLOps tiene como objetivo producir sistemas de aprendizaje automático cerrando la brecha entre el desarrollo (Dev) y las operaciones (Ops). Esencialmente, MLOps tiene como objetivo facilitar la creación de productos de aprendizaje automático aprovechando estos principios: automatización CI/CD, orquestación del flujo de trabajo, reproducibilidad; control de versiones de datos, modelo y código; colaboración; capacitación y evaluación continua de ML; Seguimiento y registro de metadatos de ML; monitoreo continuo; y circuitos de retroalimentación.[4]

Historia[editar]

Los desafíos del uso continuo del aprendizaje automático en aplicaciones se destacaron en un artículo de 2015.[5]​ El crecimiento previsto en el aprendizaje automático incluyó una duplicación estimada de las implementaciones y pilotos de ML de 2017 a 2018, y nuevamente de 2018 a 2020.[6]​ MLOps rápidamente comenzó a ganar terreno entre los expertos en IA/ML, las empresas y los periodistas de tecnología como una solución que puede abordar la complejidad y el crecimiento del aprendizaje automático en las empresas.[7][8][9]

Los informes muestran que la mayoría (hasta el 88%) de las iniciativas corporativas de aprendizaje automático tienen dificultades para superar las etapas de prueba.[4]​ Sin embargo, aquellas organizaciones que realmente pusieron el aprendizaje automático en producción obtuvieron aumentos en el margen de ganancias del 3-15%.[10]​ El mercado de MLOps se estimó en 23.200 millones de dólares en 2019 y se prevé que alcance los 126.000 millones de dólares en 2025 debido a su rápida adopción.[11]

Arquitectura[editar]

Los sistemas de aprendizaje automático se pueden clasificar en ocho categorías diferentes: recopilación de datos, procesamiento de datos, ingeniería de características, etiquetado de datos, diseño de modelos, entrenamiento y optimización de modelos, implementación de puntos finales y monitoreo de puntos finales. Cada paso del ciclo de vida del aprendizaje automático se construye en su propio sistema, pero requiere interconexión. Estos son los sistemas mínimos que las empresas necesitan para escalar el aprendizaje automático dentro de su organización.

Objetivos[editar]

Hay una serie de objetivos que las empresas desean lograr a través de sistemas MLOps que implementan con éxito ML en toda la empresa, que incluyen:[12]

  • Implementación y automatización [13]
  • Reproducibilidad de modelos y predicciones [14]
  • Diagnóstico [14]
  • Gobernanza y cumplimiento normativo [15]
  • Escalabilidad [16]
  • Colaboración [17]
  • Usos comerciales [18]
  • Seguimiento y gestión [19]

Una práctica estándar, como MLOps, tiene en cuenta cada una de las áreas antes mencionadas, lo que puede ayudar a las empresas a optimizar los flujos de trabajo y evitar problemas durante la implementación.

Una arquitectura común de un sistema MLOps incluiría plataformas de ciencia de datos donde se construyen modelos y motores analíticos donde se realizan los cálculos, con la herramienta MLOps orquestando el movimiento de modelos, datos y resultados de aprendizaje automático entre los sistemas. [12]

Véase también[editar]

Referencias[editar]

  1. a b Breuel, Cristiano (3 January 2020). «ML Ops: Machine Learning as an Engineering Discipline». Towards Data Science (en inglés). Consultado el 6 July 2021. 
  2. Talagala, Nisha. «Why MLOps (and not just ML) is your Business' New Competitive Frontier». AITrends. Consultado el 30 de enero de 2018. 
  3. Vashisth, Shubhangi. «Use Gartner's 3-Stage MLOps Framework to Successfully Operationalize Machine Learning Projects». Gartner. Consultado el 30 October 2020. 
  4. a b Kreuzberger, Dominik; Kühl, Niklas; Hirschl, Sebastian (2023). «Machine Learning Operations (MLOps): Overview, Definition, and Architecture». IEEE Access 11: 31866-31879. Bibcode:2023IEEEA..1131866K. ISSN 2169-3536. arXiv:2205.02302. doi:10.1109/ACCESS.2023.3262138. 
  5. Sculley, D.; Holt, Gary; Golovin, Daniel; Davydov, Eugene; Phillips, Todd; Ebner, Dietmar; Chaudhary, Vinay; Young, Michael et al. (7 de diciembre de 2015). «Hidden Technical Debt in Machine Learning Systems». NIPS Proceedings (2015). Consultado el 14 de noviembre de 2017. 
  6. Sallomi, Paul. «Deloitte Technology, Media and Telecommunications Predictions 2018». Deloitte. Consultado el 13 de octubre de 2017. 
  7. «MLOps Silicon Valley». Meetup (en inglés estadounidense). Consultado el 31 de mayo de 2024. 
  8. Bridgwater, Adrian (13 de abril de 2018). «Should every business function have an Ops extension?». TechHQ (en inglés estadounidense). Consultado el 31 de mayo de 2024. 
  9. «How to build AI culture: go through the curve of enlightenment | HackerNoon». hackernoon.com (en inglés). Consultado el 31 de mayo de 2024. 
  10. Bughin, Jacques. «Artificial Intelligence The Next Digital Frontier?». McKinsey. McKinsey Global Institute. Consultado el 1 June 2017. 
  11. «2021 MLOps Platforms Vendor Analysis Report». Neu.ro. Consultado el 18 March 2024. 
  12. a b Walsh, Nick. «The Rise of Quant-Oriented Devs & The Need for Standardized MLOps». Slides. Nick Walsh. Consultado el 1 January 2018. 
  13. «Code to production-ready machine learning in 4 steps». DAGsHub Blog (en inglés). 3 de febrero de 2021. Consultado el 19 de febrero de 2021. 
  14. a b Warden, Pete. «The Machine Learning Reproducibility Crisis». Pete Warden's Blog. Pete Warden. Consultado el 19 March 2018. 
  15. Vaughan, Jack. «Machine learning algorithms meet data governance». SearchDataManagement. TechTarget. Consultado el 1 de septiembre de 2017. 
  16. Lorica, Ben. «How to train and deploy deep learning at scale». O'Reilly. Consultado el 15 de marzo de 2018. 
  17. Garda, Natalie. «IoT and Machine Learning: Why Collaboration is Key». IoT Tech Expo. Encore Media Group. Consultado el 12 de octubre de 2017. 
  18. Manyika, James. «What's now and next in analytics, AI, and automation». McKinsey. McKinsey Global Institute. Consultado el 1 de mayo de 2017. 
  19. Haviv, Yaron. «MLOps Challenges, Solutions and Future Trends». Iguazio. Consultado el 19 de febrero de 2020.