The Challenge
Das ursprüngliche Hybrid-Setup von Lightricks hielt mit der wachsenden Nachfrage und den immer komplexeren Anforderungen an Machine Learning und Analytics nicht mehr Schritt. In geschäftskritischen Momenten wurde die Infrastruktur zum Nadelöhr: Daten-Uploads stießen an ihre Grenzen, Cluster fielen während Finanzierungsrunden und in Spitzenzeiten aus.
The Solution
Lightricks migrierte zu Google Cloud und setzt für die automatisierte Datenaufnahme und -analyse auf BigQuery und Dataflow. Das Team führte Google Kubernetes Engine für containerisierte Infrastruktur ein und nutzt Vertex AI für Machine-Learning-Modelle. DoiT International liefert dabei laufend Unterstützung – von der Architektur bis zur Problemlösung.
Results
- Rund 1 Milliarde Events pro Tag mit BigQuery und Dataflow verarbeiten
- Funktionsfähige Kubernetes-Infrastruktur auf GKE in wenigen Wochen mit minimalem Engineering-Aufwand aufgebaut
- Infrastruktur-Engpässe beseitigt, die zuvor in geschäftskritischen Phasen zu Systemausfällen führten
- Business Intelligence in Echtzeit für die Optimierung von Werbekampagnen auf Terabytes an Daten ermöglicht
Als wir zum Beispiel einen Cluster auf GKE aufsetzen und an unsere Machine-Learning-Systeme anbinden wollten, hat DoiT dafür gesorgt, dass unsere Data Lakes für die Forschung und unsere On-Premises-Compute sauber zusammenspielen. Unser Machine-Learning-Aufbau ist anspruchsvoll, und DoiT steht uns laufend zur Seite – von der Architektur bis zur Problemlösung.
Ofir Bibi, VP Research, Lightricks
Skalierung als Herausforderung
Mit Apps wie Facetune, Videoleap und Photoleap fand Lightricks schnell den Marktdurchbruch. Doch das rasante Wachstum brachte die hybride Cloud-on-Premises-Infrastruktur an ihre Grenzen. Das System konnte den GPU-Bedarf nicht mehr decken und bildete die zunehmend komplexen Anforderungen an Machine Learning und Analytics nicht mehr ab. Während Finanzierungsrunden und in Spitzenzeiten kam es zu kritischen Ausfällen – eine robustere Plattform musste her.
Datenaufnahme automatisiert im großen Maßstab
BigQuery und Dataflow bilden das Fundament der neuen Datenplattform von Lightricks. Heute laufen rund 10.000 Events pro Sekunde durch das System – täglich eine Milliarde. Die Autoscale-Funktion von Dataflow hat die früheren Engpässe beseitigt, an denen Daten-Uploads regelmäßig an Systemgrenzen scheiterten. Diese Automatisierung macht Business Intelligence in Echtzeit möglich: Teams optimieren Werbekampagnen auf Basis von Terabytes an Daten und sprechen Nutzer aus erfolgreichen Marketingkampagnen sofort gezielt an.
Kleine Teams, große Infrastruktur
Google Kubernetes Engine hat die Infrastruktur-Komplexität für das schlanke Engineering-Team von Lightricks drastisch reduziert. Innerhalb weniger Wochen brachten einige Engineers und DevOps-Mitarbeitende eine funktionsfähige Kubernetes-Infrastruktur an den Start – mit dem Vorgängersystem wäre das undenkbar gewesen. Die Trennung von Storage und Compute hat die Infrastrukturhürden beseitigt, die die Entwicklung zuvor ausgebremst hatten. So können sich die Teams auf den Mehrwert für das Business konzentrieren, statt Systeme zu warten.
Machine Learning auf einem neuen Niveau
Google Cloud hat die Compute-Engpässe für Machine-Learning-Workloads bei Lightricks aufgelöst. Vom experimentellen Cloud-Training im Jahr 2014 hat sich das Team zu einer robusten Plattform weiterentwickelt, auf der Compute-Ressourcen on demand bereitstehen. Marketing, Produktoptimierung und Recommendation Engine entwickeln ihre Machine-Learning-Modelle heute auf Compute Engine – und mit der Migration zu Vertex AI lassen sich Empfehlungssysteme und die Optimierung der Nutzerinteraktion noch schneller skalieren.
Sichere Drittanbieter-Integrationen
Dank der Integrationsmöglichkeiten von Google Cloud kann Lightricks Drittanbieter-Dienste wie Cloudinary und Elasticsearch sicher anbinden. Die Plattform leitet Traffic sicher außerhalb privater Netzwerke weiter, ohne Systeme dem öffentlichen Internet auszusetzen. Dieses Sicherheitsframework stützt die Backend-Entwicklung von Lightricks: Das Unternehmen baut seine Services auf Open-Source-Technologien auf – bei robustem Schutz.
Weiteres Wachstum und Plattformausbau
Für 2022 plant Lightricks einen umfangreichen Ausbau seiner Backend-Services, darunter app-übergreifende Profile und Funktionen für den Medien-Upload. Dieses Wachstum erzeugt mehr Daten und erfordert leistungsfähigere Machine-Learning-Modelle. Mit Google Cloud im Rücken kann das Unternehmen schnell und kosteneffizient skalieren, seine Creator-Plattform weiterentwickeln und dabei State-of-the-Art-Services für die Content-Erstellung liefern.
So unterstützt DoiT Cloud-Teams bei der Kostenkontrolle
Erfahren Sie, wie DoiT Cloud Intelligence Teams hilft, Transparenz, Governance und Unit Economics in Cloud-Umgebungen zu verbessern.
More customer stories
Promptly spart 600.000 $ und bringt KI in Wochen live
- $600K
- Jährliche Cloud-Kosteneinsparungen
- 3 months
- Eingesparte Engineering-Zeit
Extenda Retail senkt SSD-Waste und beschleunigt AI
Monta skaliert auf über 250.000 EV-Ladepunkte
- 250,000
- Weltweit verwaltete EV-Ladepunkte
Wicked Reports bringt GenAI 3 Monate früher live
- 3 months saved
- Entwicklungszeit gespart mit dem DoiT Cloud Accelerator
- 25% faster
- Zeit vom Prototyp zur Produktion gegenüber internen Schätzungen
- $0 additional spend
- keine zusätzlichen Infrastrukturkosten beim Prototypenbau – dank AWS-Credits und DoiT-Optimierung
DaySmart launcht KI-Funktion in 90 Tagen
- 90 days
- Vom POC zum Deployment
- 90 days
- Vom POC zum Deployment ohne interne Engineering-Zeit
- 6x
- Eingesparte Engineers-Ressourcen
Vivaticket verkürzt das Aufsetzen von AWS-Umgebungen von 3 Tagen auf 15 Minuten
- 15min
- Zeit für neue Umgebungen
- 15min
- Bereitstellungszeit neuer Umgebungen (statt zuvor 3 Tage)
- 20min
- Application-Deployment im Immutable-Modus
Blumira skaliert SOC Auto-Focus mit voller Kostenkontrolle
What they say
What I really like about DoiT's approach is that you're very hands-on and proactive. Satyam would ping me a few times a sprint, letting me know about the most current features, checking in on how things are going. When we are going through a peak time, that proactiveness makes a real difference. Satyam always comes through whenever we need support and helps us leverage the right experts to get us where we need to be.
Chiamaka Ibeme, Engineering Manager, Platform
SELECT has made important cost data readily accessible. I will often pull it up during engineering design reviews so we can quickly evaluate cost impact and projections and factor that into our design decisions.
Douglas Zickuhr, Senior Data Platform Engineer at Personio
I love clicking through SELECT to understand how our environment and workloads are evolving. I probably check it every day. It's coffee and SELECT for me every morning.
Ian Fahey, Senior Analytics Engineer at Loop
You guys have the best UI experience that I've had of any software. It's like you just read my mind where, like, oh, I wish I could click there. Oh, I can
Diana Koshy, Sr. Director of Data Engineering at Kargo
SELECT feels like exactly what Paul and I would have built if we had locked ourselves in a room for 18 months to create our ideal monitoring solution.
Devin McGee, Data Engineering Lead at Home Chef
SELECT dramatically lowers the cognitive load to understanding Snowflake costs. I'm able to sit there and easily understand what's driving the cost. Not to blow smoke up your ass, but it's just so easy to do in your platform
Blake Baggett, Head of Data Operations at Entain
One of the most helpful cost rituals we've setup from SELECT is the weekly spend digest sent to Slack. I can start high level and ensure things are in check. If not, I can very quickly drill down into specific workloads which may have driven the cost spike and remediate them before they become a bigger issue.
Michael Revelo, Manager of data and analytics engineering at ClickUp
Through SELECT's automated savings feature and deep cost visibility, we were able to instantly lower our Snowflake spend by over 40% and achieve a 20X ROI on our SELECT investment.
Skyler Chi, SVP, GTM Productivity & Excellence at Exiger
Our costs had jumped up 3X as we scaled, so we're talking about 60% savings in Snowflake spend after adopting SELECT.
Edward Mancey, GTM Lead at Synthesia
DoiT was a true partner, not a vendor. They helped us understand the problem, refine the vision, and build something production-ready far faster than we could have on our own. Their expertise, responsiveness, and commitment made all the difference.
Dr. Anish Kapur, Founder & CEO, Promptly
DoiT's Customer Success and Forward Deployed Engineering teams work very closely with us. The regular sessions with our CSM keep us focused on the right priorities, and the FDEs provide the deep technical guidance we need to validate decisions and optimize our environment. That combination has been genuinely valuable for us.
Alexander Lundberg Santos, Platform Engineer at Extenda Retail
Every customer has unique usage patterns. Manual resource optimization simply didn't scale—we needed automation to ensure every customer, regardless of size, had right-sized infrastructure without consuming our team's capacity.
Brad Quinn, Lead Platform Engineer, PlayHQ
PerfectScale allowed us to grow capacity without growing cost. We effectively absorbed 30% more usage for free.
Thomas Comtet, Senior Staff Engineer, SNCF
Your cloud bill shouldn't be a mystery
Let us show you what ships this week.

