Cloud Intelligence™Cloud Intelligence™

Esta página también está disponible en English, Deutsch, Français, Italiano, 日本語 y Português.

mscope reduce costos de ML y acelera sus insights de inversión

DoiT rediseñó el stack de AWS de mscope con SageMaker, Step Functions y Bedrock para hacer fine-tuning de LLMs sobre datos multilingües y clasificar empresas con mayor inteligencia.

Cloud Intelligence™
mscope

The Challenge

Al ser una startup en etapa temprana, mscope no contaba con experiencia interna en machine learning y necesitaba montar la infraestructura para entrenar y desplegar modelos. Buscaba generar texto en inglés a partir de datos multilingües obtenidos por web scraping usando LLMs, y a la vez implementar un sistema sofisticado de clasificación multinivel para categorizar empresas según su rol en la cadena de suministro y las características de sus productos.

The Solution

DoiT brindó una consultoría integral de machine learning que abarcó la planificación de costos en AWS, el diseño de la arquitectura para hacer fine-tuning de modelos transformer como Mistral 7B con el framework de HuggingFace, y la optimización de los workflows. DoiT recomendó reemplazar los costosos clusters de EMR por SageMaker batch transform orquestado con Step Functions, y consiguió acceso anticipado a Amazon Bedrock para experimentar con LLMs de forma costo-eficiente.

Results

  • Mejor preprocesamiento de los datos multilingües de web scraping, con un salto en el rendimiento del algoritmo de clasificación
  • Tiempos de procesamiento optimizados y costos más bajos gracias a las mejoras de arquitectura
  • Insights valiosos a partir de datos multilingües para tomar mejores decisiones de inversión

Estamos muy agradecidos con DoiT por el enorme apoyo que nos brindaron. Como startup en etapa temprana enfrentando desafíos complejos con nuevas técnicas de machine learning, su expertise fue clave. Desde planificar el presupuesto de los servicios de AWS hasta diseñar una solución a la medida, su acompañamiento nos permitió aprovechar tecnologías avanzadas de forma efectiva. La solución de DoiT dio resultados contundentes: pudimos sacarle mucho más provecho a nuestros datos de web scraping, extraer más insights y mejorar nuestro algoritmo de clasificación.

Marion Roussel, VP de Data en mscope

Conoce a mscope

mscope.tech es una startup dinámica en etapa temprana dedicada a sacarle el máximo provecho a los datos para tomar decisiones de inversión informadas. Con una visión clara, su objetivo es aprovechar el valor oculto en grandes volúmenes de información. Apoyándose en tecnologías de vanguardia como machine learning e IA, mscope busca transformar el análisis de datos y se enfoca en desarrollar metodologías de última generación para resumir documentos y extraer características clave de los datos obtenidos por web scraping.

El desafío

Como startup en etapa temprana, mscope enfrentaba varios retos por la falta de experiencia interna en machine learning. Necesitaba definir cómo montar la infraestructura y los workflows para entrenar y desplegar modelos con sus datos. mscope también tenía que generar texto en un idioma común (inglés) a partir de datos multilingües obtenidos por web scraping usando large language models (LLMs). Además, requería un sistema sofisticado de clasificación multinivel para etiquetar empresas según su rol en la cadena de suministro y la naturaleza de sus productos.

La solución

mscope recurrió a los servicios expertos de DoiT para resolver sus necesidades de machine learning. DoiT acompañó a mscope en la planificación y estimación de costos de los servicios de AWS necesarios, y diseñó una solución para hacer fine-tuning de modelos basados en transformers como Mistral 7B, con el framework de HuggingFace. La recomendación fue optar por SageMaker batch transform para ejecutar los distintos pasos e invocar el modelo de SageMaker de forma asincrónica, todo orquestado con Step Functions. Gracias a su relación con AWS, DoiT consiguió para mscope acceso anticipado a Amazon Bedrock.

Los resultados

La solución de DoiT tuvo un impacto profundo en mscope y entregó resultados significativos. Al apostar por modelos avanzados como los LLMs, mscope mejoró el preprocesamiento de sus datos multilingües crudos de web scraping, lo que se tradujo en un mejor rendimiento del algoritmo de clasificación. DoiT acompañó a mscope para aprovechar los LLMs, optimizar los tiempos de procesamiento y reducir costos. Gracias al expertise de DoiT en AWS, mscope también recibió apoyo para resolver problemas en los endpoints de SageMaker y en el uso del cluster de EMR.

Lo que viene

Tras el éxito de la colaboración, mscope quiere continuar esta alianza para construir un nuevo clasificador de empresas. Con los datos de entrada de web scraping ya mejorados, el foco ahora se traslada a seguir perfeccionando la clasificación de las empresas de mscope. La alianza demuestra el valor sostenido del expertise de DoiT para ayudar a las startups a aprovechar tecnologías cloud avanzadas y hacer crecer su negocio.

Descubre cómo DoiT ayuda a los equipos cloud a controlar su gasto

Explora cómo DoiT Cloud Intelligence le ayuda a los equipos a mejorar la visibilidad, el gobierno y la unit economics en sus entornos cloud.

More customer stories

Promptly

Promptly ahorra US$600K y lanza IA en semanas

$600K
Ahorro anual en costos de nube
3 months
Tiempo de ingeniería ahorrado
Monta

Monta llega a más de 250 mil puntos de carga para vehículos eléctricos

250,000
Puntos de carga gestionados a nivel global
Wicked Reports

Wicked Reports lanza su GenAI 3 meses antes

3 months saved
de tiempo de desarrollo ahorrado con el Cloud Accelerator de DoiT
25% faster
del tiempo de prototipo a producción frente a las estimaciones internas
$0 additional spend
cero gasto adicional en infraestructura durante la fase de prototipo, gracias a los créditos de AWS y a la optimización de DoiT
DaySmart

DaySmart lanza una capacidad de IA en 90 días

90 days
Del POC al despliegue
90 days
Del POC al despliegue sin consumir tiempo del equipo interno de Engineering
6x
Engineers equivalentes en recursos ahorrados
Vivaticket

Vivaticket pasa de 3 días a 15 minutos en la creación de entornos en AWS

15min
Tiempo de creación de entornos
15min
Tiempo de creación de entornos (vs 3 días antes)
20min
Despliegue de aplicaciones en modo inmutable

What they say

Luxury Escapes

What I really like about DoiT's approach is that you're very hands-on and proactive. Satyam would ping me a few times a sprint, letting me know about the most current features, checking in on how things are going. When we are going through a peak time, that proactiveness makes a real difference. Satyam always comes through whenever we need support and helps us leverage the right experts to get us where we need to be.

Chiamaka Ibeme, Engineering Manager, Platform

Personio

SELECT has made important cost data readily accessible. I will often pull it up during engineering design reviews so we can quickly evaluate cost impact and projections and factor that into our design decisions.

Douglas Zickuhr, Senior Data Platform Engineer at Personio

Loop Returns

I love clicking through SELECT to understand how our environment and workloads are evolving. I probably check it every day. It's coffee and SELECT for me every morning.

Ian Fahey, Senior Analytics Engineer at Loop

Kargo

You guys have the best UI experience that I've had of any software. It's like you just read my mind where, like, oh, I wish I could click there. Oh, I can

Diana Koshy, Sr. Director of Data Engineering at Kargo

Home Chef

SELECT feels like exactly what Paul and I would have built if we had locked ourselves in a room for 18 months to create our ideal monitoring solution.

Devin McGee, Data Engineering Lead at Home Chef

Entain

SELECT dramatically lowers the cognitive load to understanding Snowflake costs. I'm able to sit there and easily understand what's driving the cost. Not to blow smoke up your ass, but it's just so easy to do in your platform

Blake Baggett, Head of Data Operations at Entain

ClickUp

One of the most helpful cost rituals we've setup from SELECT is the weekly spend digest sent to Slack. I can start high level and ensure things are in check. If not, I can very quickly drill down into specific workloads which may have driven the cost spike and remediate them before they become a bigger issue.

Michael Revelo, Manager of data and analytics engineering at ClickUp

Exiger

Through SELECT's automated savings feature and deep cost visibility, we were able to instantly lower our Snowflake spend by over 40% and achieve a 20X ROI on our SELECT investment.

Skyler Chi, SVP, GTM Productivity & Excellence at Exiger

Synthesia

Our costs had jumped up 3X as we scaled, so we're talking about 60% savings in Snowflake spend after adopting SELECT.

Edward Mancey, GTM Lead at Synthesia

Promptly

DoiT was a true partner, not a vendor. They helped us understand the problem, refine the vision, and build something production-ready far faster than we could have on our own. Their expertise, responsiveness, and commitment made all the difference.

Dr. Anish Kapur, Founder & CEO, Promptly

Extenda Retail

DoiT's Customer Success and Forward Deployed Engineering teams work very closely with us. The regular sessions with our CSM keep us focused on the right priorities, and the FDEs provide the deep technical guidance we need to validate decisions and optimize our environment. That combination has been genuinely valuable for us.

Alexander Lundberg Santos, Platform Engineer at Extenda Retail

PlayHQ

Every customer has unique usage patterns. Manual resource optimization simply didn't scale—we needed automation to ensure every customer, regardless of size, had right-sized infrastructure without consuming our team's capacity.

Brad Quinn, Lead Platform Engineer, PlayHQ

SNCF

PerfectScale allowed us to grow capacity without growing cost. We effectively absorbed 30% more usage for free.

Thomas Comtet, Senior Staff Engineer, SNCF

Your cloud bill shouldn't be a mystery

Let us show you what ships this week.