Cette page est également disponible en English, Deutsch, Español, Italiano, 日本語 et Português.
mscope réduit ses coûts ML et accélère ses analyses d'investissement
DoiT a repensé la stack AWS de mscope avec SageMaker, Step Functions et Bedrock pour affiner des LLM sur des données multilingues et classifier les entreprises avec plus de finesse.

The Challenge
Startup en phase d'amorçage, mscope ne disposait pas d'expertise interne en machine learning et devait mettre en place l'infrastructure nécessaire pour entraîner et déployer ses modèles. L'équipe cherchait à générer du texte en anglais à partir de données web multilingues via des LLM, et à déployer un système de classification multi-niveaux capable de catégoriser les entreprises selon leur rôle dans la supply chain et les caractéristiques de leurs produits.
The Solution
DoiT a fourni un accompagnement complet en machine learning : budgétisation AWS, conception d'une architecture pour le fine-tuning de modèles transformers comme Mistral 7B avec le framework HuggingFace, et optimisation des workflows. DoiT a recommandé de remplacer les clusters EMR coûteux par SageMaker batch transform orchestré avec Step Functions, et a obtenu un accès anticipé à Amazon Bedrock pour expérimenter les LLM à moindre coût.
Results
- Améliorer le prétraitement des données web multilingues pour renforcer la performance de l'algorithme de classification
- Réduire les temps de traitement et les coûts grâce aux optimisations architecturales
- Tirer des enseignements précieux des données multilingues pour mieux décider de ses investissements
Nous sommes reconnaissants du soutien remarquable apporté par DoiT. Pour une startup en phase d'amorçage confrontée aux défis complexes des nouvelles techniques de machine learning, l'expertise de DoiT a été déterminante. De la budgétisation des services AWS à la conception d'une architecture sur mesure, leurs conseils nous ont permis de tirer pleinement parti des technologies avancées. La solution de DoiT a produit des résultats marquants : nous exploitons désormais nos données de web scraping bien plus efficacement, en tirons davantage d'enseignements et avons amélioré notre algorithme de classification.
Marion Roussel, VP Data chez mscope
À propos de mscope
mscope.tech est une startup dynamique en phase d'amorçage, dédiée à exploiter pleinement le potentiel des données au service des décisions d'investissement. Animée par une vision claire, elle a pour ambition de révéler et de valoriser la richesse cachée dans de vastes volumes d'information. En s'appuyant sur des technologies de pointe comme le machine learning et l'IA, mscope entend transformer l'analyse des données. Ses efforts se concentrent sur le développement de méthodologies avancées pour résumer des documents et extraire les caractéristiques clés de données issues du web.
Le défi
Startup en phase d'amorçage, mscope se heurtait à plusieurs défis liés au manque d'expertise interne en machine learning. L'équipe devait déterminer comment mettre en place l'infrastructure et les workflows nécessaires pour entraîner et déployer ses modèles sur ses données. mscope avait besoin de générer du texte dans une langue commune (l'anglais) à partir de données web multilingues à l'aide de grands modèles de langage (LLM). Il lui fallait également un système de classification multi-niveaux sophistiqué pour étiqueter les entreprises selon leur rôle dans la supply chain et la nature de leurs produits.
La solution
mscope a fait appel aux experts de DoiT pour répondre à ses besoins en machine learning. DoiT a accompagné mscope dans la budgétisation et l'estimation des coûts des services AWS nécessaires, puis a conçu une solution de fine-tuning de modèles transformers comme Mistral 7B, appuyée par le framework HuggingFace. DoiT a recommandé à mscope d'opter pour SageMaker batch transform afin d'exécuter les différentes étapes et d'invoquer le modèle SageMaker de manière asynchrone, le tout orchestré avec Step Functions. Sa relation privilégiée avec AWS a également permis à mscope d'obtenir un accès anticipé à Amazon Bedrock.
Les résultats
La solution de DoiT a profondément marqué mscope, avec des résultats significatifs à la clé. En préconisant le recours à des modèles avancés comme les LLM, mscope a amélioré le prétraitement de ses données brutes de web scraping multilingues, ce qui a renforcé son algorithme de classification. DoiT a aidé mscope à tirer parti des LLM, à optimiser les temps de traitement et à réduire les coûts. Grâce à l'expertise AWS de DoiT, mscope a également pu résoudre des problèmes liés aux endpoints SageMaker et à l'utilisation des clusters EMR.
Et la suite
Fort du succès de cette collaboration, mscope souhaite poursuivre ce partenariat pour développer un nouveau classifieur d'entreprises. Après avoir amélioré les données d'entrée issues du web scraping, l'attention se portera désormais sur l'amélioration de la classification des entreprises mscope. Ce partenariat illustre la valeur durable de l'expertise de DoiT pour aider les startups à mettre les technologies cloud avancées au service de leur croissance.
Découvrez comment DoiT aide les équipes cloud à maîtriser leurs dépenses
Découvrez comment DoiT Cloud Intelligence aide les équipes à gagner en visibilité, en gouvernance et en unit economics sur l'ensemble de leurs environnements cloud.
More customer stories
Promptly économise 600 000 $ et livre son IA en quelques semaines
- $600K
- D'économies annuelles sur le cloud
- 3 months
- De temps d'ingénierie économisé
Extenda Retail réduit le gaspillage SSD et accélère l'IA
Monta franchit le cap des 250 000 points de recharge VE
- 250,000
- Points de recharge VE gérés dans le monde
Wicked Reports livre sa GenAI 3 mois plus tôt
- 3 months saved
- de temps de développement économisés grâce au Cloud Accelerator de DoiT
- 25% faster
- de délai prototype-production par rapport aux estimations internes
- $0 additional spend
- zéro dépense d'infrastructure additionnelle pendant la phase de prototype, grâce aux crédits AWS et à l'optimisation de DoiT
DaySmart livre une fonctionnalité IA en 90 jours
- 90 days
- Du POC au déploiement
- 90 days
- Du POC au déploiement sans aucun Engineer interne mobilisé
- 6x
- D'Engineers économisés en équivalent ressource
Vivaticket fait passer la création d'environnements AWS de 3 jours à 15 minutes
- 15min
- Création d'un environnement
- 15min
- Création d'un environnement (contre 3 jours auparavant)
- 20min
- Déploiement d'applications en mode immuable
Blumira passe SOC Auto-Focus à l'échelle sans dérive de coûts
What they say
What I really like about DoiT's approach is that you're very hands-on and proactive. Satyam would ping me a few times a sprint, letting me know about the most current features, checking in on how things are going. When we are going through a peak time, that proactiveness makes a real difference. Satyam always comes through whenever we need support and helps us leverage the right experts to get us where we need to be.
Chiamaka Ibeme, Engineering Manager, Platform
SELECT has made important cost data readily accessible. I will often pull it up during engineering design reviews so we can quickly evaluate cost impact and projections and factor that into our design decisions.
Douglas Zickuhr, Senior Data Platform Engineer at Personio
I love clicking through SELECT to understand how our environment and workloads are evolving. I probably check it every day. It's coffee and SELECT for me every morning.
Ian Fahey, Senior Analytics Engineer at Loop
You guys have the best UI experience that I've had of any software. It's like you just read my mind where, like, oh, I wish I could click there. Oh, I can
Diana Koshy, Sr. Director of Data Engineering at Kargo
SELECT feels like exactly what Paul and I would have built if we had locked ourselves in a room for 18 months to create our ideal monitoring solution.
Devin McGee, Data Engineering Lead at Home Chef
SELECT dramatically lowers the cognitive load to understanding Snowflake costs. I'm able to sit there and easily understand what's driving the cost. Not to blow smoke up your ass, but it's just so easy to do in your platform
Blake Baggett, Head of Data Operations at Entain
One of the most helpful cost rituals we've setup from SELECT is the weekly spend digest sent to Slack. I can start high level and ensure things are in check. If not, I can very quickly drill down into specific workloads which may have driven the cost spike and remediate them before they become a bigger issue.
Michael Revelo, Manager of data and analytics engineering at ClickUp
Through SELECT's automated savings feature and deep cost visibility, we were able to instantly lower our Snowflake spend by over 40% and achieve a 20X ROI on our SELECT investment.
Skyler Chi, SVP, GTM Productivity & Excellence at Exiger
Our costs had jumped up 3X as we scaled, so we're talking about 60% savings in Snowflake spend after adopting SELECT.
Edward Mancey, GTM Lead at Synthesia
DoiT was a true partner, not a vendor. They helped us understand the problem, refine the vision, and build something production-ready far faster than we could have on our own. Their expertise, responsiveness, and commitment made all the difference.
Dr. Anish Kapur, Founder & CEO, Promptly
DoiT's Customer Success and Forward Deployed Engineering teams work very closely with us. The regular sessions with our CSM keep us focused on the right priorities, and the FDEs provide the deep technical guidance we need to validate decisions and optimize our environment. That combination has been genuinely valuable for us.
Alexander Lundberg Santos, Platform Engineer at Extenda Retail
Every customer has unique usage patterns. Manual resource optimization simply didn't scale—we needed automation to ensure every customer, regardless of size, had right-sized infrastructure without consuming our team's capacity.
Brad Quinn, Lead Platform Engineer, PlayHQ
PerfectScale allowed us to grow capacity without growing cost. We effectively absorbed 30% more usage for free.
Thomas Comtet, Senior Staff Engineer, SNCF
Your cloud bill shouldn't be a mystery
Let us show you what ships this week.
