Diese Seite ist auch in English, Español, Français, Italiano, 日本語 und Português verfügbar.
mscope senkt ML-Kosten und kommt schneller zu Investment-Insights
DoiT hat den AWS-Stack von mscope mit SageMaker, Step Functions und Bedrock neu aufgesetzt, um LLMs auf mehrsprachigen Daten für eine präzisere Unternehmensklassifizierung zu fine-tunen.

The Challenge
Als Startup in der Frühphase fehlte mscope das eigene Machine-Learning-Know-how, und es musste erst eine Infrastruktur zum Training und Deployment von Modellen aufgebaut werden. Gefragt waren Lösungen, um aus mehrsprachigen Web-Scraping-Daten per LLM englische Texte zu erzeugen – und ein mehrstufiges Klassifizierungssystem, das Unternehmen anhand ihrer Rolle in der Lieferkette und ihrer Produktmerkmale einordnet.
The Solution
DoiT lieferte umfassendes Machine-Learning-Consulting: von der AWS-Kostenplanung über das Architekturdesign für das Fine-Tuning von Transformer-Modellen wie Mistral 7B mit dem HuggingFace-Framework bis hin zur Workflow-Optimierung. DoiT empfahl, teure EMR-Cluster durch SageMaker Batch Transform mit Step-Functions-Orchestrierung zu ersetzen, und sicherte mscope frühzeitigen Zugang zu Amazon Bedrock für kosteneffizientes Experimentieren mit LLMs.
Results
- Bessere Vorverarbeitung mehrsprachiger Web-Scraping-Daten und damit höhere Leistung des Klassifizierungsalgorithmus
- Kürzere Verarbeitungszeiten und geringere Kosten durch eine optimierte Architektur
- Wertvolle Insights aus mehrsprachigen Daten für fundiertere Investmententscheidungen
Wir sind DoiT für die enorme Unterstützung sehr dankbar. Als Startup in der Frühphase, das sich mit neuen Machine-Learning-Techniken durch komplexes Terrain bewegt, war die Expertise von DoiT entscheidend. Von der Budgetierung der AWS-Services bis zur Architektur einer maßgeschneiderten Lösung – die Beratung hat uns in die Lage versetzt, fortschrittliche Technologien wirklich nutzbar zu machen. Die Lösung von DoiT hat tiefgreifende Ergebnisse gebracht: Wir nutzen unsere Web-Scraping-Daten deutlich effizienter, gewinnen mehr Erkenntnisse daraus und haben unseren Klassifizierungsalgorithmus spürbar verbessert.
Marion Roussel, VP Data bei mscope
Das ist mscope
mscope.tech ist ein dynamisches Startup in der Frühphase, das das Potenzial von Daten für fundierte Investmententscheidungen voll ausschöpfen will. Mit klarer Vision verfolgt das Unternehmen ein zentrales Ziel: den verborgenen Wert in riesigen Informationsmengen freizulegen und nutzbar zu machen. Mit modernsten Technologien wie Machine Learning und KI will mscope die Datenanalyse neu denken. Im Fokus stehen innovative Methoden, um Dokumente zusammenzufassen und entscheidende Merkmale aus Web-Scraping-Daten zu extrahieren.
Die Herausforderung
Als Startup in der Frühphase stand mscope vor mehreren Herausforderungen, denn intern fehlte es an Machine-Learning-Expertise. Es galt herauszufinden, wie sich die nötige Infrastruktur und die Workflows aufbauen lassen, um Modelle auf den eigenen Daten zu trainieren und zu deployen. mscope musste aus mehrsprachigen Web-Scraping-Daten mithilfe von Large Language Models (LLMs) Texte in einer einheitlichen Sprache (Englisch) erzeugen. Zudem brauchte es ein ausgefeiltes mehrstufiges Klassifizierungssystem, um Unternehmen nach ihrer Rolle in der Lieferkette und der Art ihrer Produkte zu kennzeichnen.
Die Lösung
mscope holte sich DoiT als Expertenpartner ins Boot, um die Machine-Learning-Anforderungen gemeinsam anzugehen. DoiT unterstützte bei der Budgetierung und Kostenschätzung der erforderlichen AWS-Services und entwarf eine Lösung für das Fine-Tuning transformerbasierter Modelle wie Mistral 7B auf Basis des HuggingFace-Frameworks. Die Empfehlung: SageMaker Batch Transform für die Ausführung der einzelnen Schritte und den asynchronen Aufruf des SageMaker-Modells, orchestriert über Step Functions. Über die enge Beziehung zu AWS konnte DoiT zudem frühzeitigen Zugang zu Amazon Bedrock für mscope sichern.
Die Ergebnisse
Die Lösung von DoiT hat mscope deutlich vorangebracht und spürbare Ergebnisse geliefert. Durch den Einsatz fortschrittlicher Modelle wie LLMs konnte mscope die Vorverarbeitung der mehrsprachigen Roh-Web-Scraping-Daten verbessern – und damit auch den Klassifizierungsalgorithmus optimieren. DoiT half mscope dabei, LLMs effektiv zu nutzen, Verarbeitungszeiten zu verkürzen und Kosten zu senken. Dank der AWS-Expertise von DoiT erhielt mscope außerdem Unterstützung bei Problemen rund um SageMaker-Endpoints und die Nutzung von EMR-Clustern.
Wie es weitergeht
Auf Basis dieser erfolgreichen Zusammenarbeit will mscope die Partnerschaft fortsetzen und einen neuen Unternehmensklassifizierer entwickeln. Nachdem die Web-Scraping-Eingangsdaten deutlich verbessert wurden, liegt der Fokus jetzt darauf, die Klassifizierung der mscope-Unternehmen weiter zu schärfen. Die Zusammenarbeit zeigt einmal mehr, welchen nachhaltigen Mehrwert die Expertise von DoiT bietet, wenn Startups moderne Cloud-Technologien für ihr Wachstum nutzen wollen.
So unterstützt DoiT Cloud-Teams bei der Kostenkontrolle
Entdecken Sie, wie DoiT Cloud Intelligence Teams dabei hilft, Transparenz, Governance und Unit Economics in Cloud-Umgebungen zu verbessern.
More customer stories
Promptly spart 600.000 $ und bringt KI in Wochen live
- $600K
- Jährliche Cloud-Kosteneinsparungen
- 3 months
- Eingesparte Engineering-Zeit
Extenda Retail senkt SSD-Waste und beschleunigt AI
Monta skaliert auf über 250.000 EV-Ladepunkte
- 250,000
- Weltweit verwaltete EV-Ladepunkte
Wicked Reports bringt GenAI 3 Monate früher live
- 3 months saved
- Entwicklungszeit gespart mit dem DoiT Cloud Accelerator
- 25% faster
- Zeit vom Prototyp zur Produktion gegenüber internen Schätzungen
- $0 additional spend
- keine zusätzlichen Infrastrukturkosten beim Prototypenbau – dank AWS-Credits und DoiT-Optimierung
DaySmart launcht KI-Funktion in 90 Tagen
- 90 days
- Vom POC zum Deployment
- 90 days
- Vom POC zum Deployment ohne interne Engineering-Zeit
- 6x
- Eingesparte Engineers-Ressourcen
Vivaticket verkürzt das Aufsetzen von AWS-Umgebungen von 3 Tagen auf 15 Minuten
- 15min
- Zeit für neue Umgebungen
- 15min
- Bereitstellungszeit neuer Umgebungen (statt zuvor 3 Tage)
- 20min
- Application-Deployment im Immutable-Modus
Blumira skaliert SOC Auto-Focus mit voller Kostenkontrolle
What they say
What I really like about DoiT's approach is that you're very hands-on and proactive. Satyam would ping me a few times a sprint, letting me know about the most current features, checking in on how things are going. When we are going through a peak time, that proactiveness makes a real difference. Satyam always comes through whenever we need support and helps us leverage the right experts to get us where we need to be.
Chiamaka Ibeme, Engineering Manager, Platform
SELECT has made important cost data readily accessible. I will often pull it up during engineering design reviews so we can quickly evaluate cost impact and projections and factor that into our design decisions.
Douglas Zickuhr, Senior Data Platform Engineer at Personio
I love clicking through SELECT to understand how our environment and workloads are evolving. I probably check it every day. It's coffee and SELECT for me every morning.
Ian Fahey, Senior Analytics Engineer at Loop
You guys have the best UI experience that I've had of any software. It's like you just read my mind where, like, oh, I wish I could click there. Oh, I can
Diana Koshy, Sr. Director of Data Engineering at Kargo
SELECT feels like exactly what Paul and I would have built if we had locked ourselves in a room for 18 months to create our ideal monitoring solution.
Devin McGee, Data Engineering Lead at Home Chef
SELECT dramatically lowers the cognitive load to understanding Snowflake costs. I'm able to sit there and easily understand what's driving the cost. Not to blow smoke up your ass, but it's just so easy to do in your platform
Blake Baggett, Head of Data Operations at Entain
One of the most helpful cost rituals we've setup from SELECT is the weekly spend digest sent to Slack. I can start high level and ensure things are in check. If not, I can very quickly drill down into specific workloads which may have driven the cost spike and remediate them before they become a bigger issue.
Michael Revelo, Manager of data and analytics engineering at ClickUp
Through SELECT's automated savings feature and deep cost visibility, we were able to instantly lower our Snowflake spend by over 40% and achieve a 20X ROI on our SELECT investment.
Skyler Chi, SVP, GTM Productivity & Excellence at Exiger
Our costs had jumped up 3X as we scaled, so we're talking about 60% savings in Snowflake spend after adopting SELECT.
Edward Mancey, GTM Lead at Synthesia
DoiT was a true partner, not a vendor. They helped us understand the problem, refine the vision, and build something production-ready far faster than we could have on our own. Their expertise, responsiveness, and commitment made all the difference.
Dr. Anish Kapur, Founder & CEO, Promptly
DoiT's Customer Success and Forward Deployed Engineering teams work very closely with us. The regular sessions with our CSM keep us focused on the right priorities, and the FDEs provide the deep technical guidance we need to validate decisions and optimize our environment. That combination has been genuinely valuable for us.
Alexander Lundberg Santos, Platform Engineer at Extenda Retail
Every customer has unique usage patterns. Manual resource optimization simply didn't scale—we needed automation to ensure every customer, regardless of size, had right-sized infrastructure without consuming our team's capacity.
Brad Quinn, Lead Platform Engineer, PlayHQ
PerfectScale allowed us to grow capacity without growing cost. We effectively absorbed 30% more usage for free.
Thomas Comtet, Senior Staff Engineer, SNCF
Your cloud bill shouldn't be a mystery
Let us show you what ships this week.
