30. Oktober 2012 – Gepostet von MozCTO in Management / Culture
Wenn wir daran arbeiten, ein unmittelbares Problem zu lösen – vor allem dann, wenn es sich um eines handelt, das Kunden betrifft – ist es oft schwierig, stehen zu bleiben und durchzuatmen. Aber manchmal ist dieses Durchatmen genau das, was für die Lösung nötig ist.
Ein Schritt zurück
Der letzte Monat war ein wenig hart für unser „Big Data”-Team. Wir verbrachten den Grossteil des Monates mit gesenkten Köpfen damit, Probleme mit Rankings und Stichwortschwierigkeiten zu lösen. Unsere technischen Schulden krochen langsam auf uns zu. Ich wollte meinem natürlichen Zwang nachgeben, mich hinhocken, auf den Problemen herumkauen, um einen Plan zu entwickeln, der so viel wie möglich beheben sollte. Leider hatte ich dauernd Meetings geplant, die meinem Plan im Weg standen und somit zu keiner Lösungsfindung führten.
Hier bei Moz nimmt jeder Mitarbeiter an wöchentlichen oder an alle zwei Wochen stattfindenden Meetings mit Managern oder Teammitgliedern teil, um unsere Ziele weiterhin verfolgen zu können. Diese „1 on 1“-Meetings sind eine Chance für Teamkollegen als Sprachrohre für Projektideen oder als Ideengeneratoren für Lösungsfindungen zu fungieren. Diese Meetings sind ein wichtiger Bestandteil unserer Kultur, aber an diesem einen Tag lag mein Fokus woanders und ich hatte keine Zeit für mein „1 on 1“ mit Matt Peters, unserem super Datenwissenschaftler. Mit dem Bewusstsein, dass wir unser letztes Meeting versäumt hatten, plante ich widerwillig Zeit für das Meeting ein. Nach unserem gewöhnlichen Gespräch über Algorithmen, Zusammenhänge und künftige Schritte für die Vergrösserung seines Teams begannen wir damit, mit Ideen herumzuspielen, wie man Geld bei der Verarbeitung sparen könnte. Für die Datenverarbeitung geben wir $ 800.000 aus und bekommen dafür nichts zurück. Der momentane Plan war schlichtweg unhaltbar. Matt beschrieb das Problem mit seiner wissenschaftlichen Art durch exakte Zahlen. Ich werde Ihnen diese Zahlen nun vereinfacht darstellen:
- Auf lange Sicht wussten wir, dass wir die Probleme mit Amazon in den Griff bekommen mussten, aber stattdessen verpassten wir unser Index-Erscheinungsdatum.
- Auf kurze Sicht schien es vernünftig, mehr Server aufzustellen und den Index schneller zu erledigen.
- In Wirklichkeit verursachte es nur noch mehr Kosten und zusätzliche Server-Fehler, mehr Server bei Amazon zum Laufen zu bringen. Die derzeitige Lösung traf das Problem nicht nur nicht, sondern verschlimmerte es noch, indem die Lösung dem Team Zeit stiehlt, um die Langzeitprobleme zu lösen.
Indem man einen Schritt vom unmittelbaren Problem zurücktritt, klärt sich die Tatsache, dass der momentane Ansatz nicht funktionierte.
Einen besseren Plan entwickeln
Nach dem Einblick, den ich durch mein „1 on 1”-Meeting mit Matt gewann, war es klar, dass wir unseren Ansatz verändern mussten. Matt und ich skizzierten einen ultimativen Plan, um die Kosten zu senken und dabei zusätzliches Potential durch das Herausbringen weiterer Indizes zu erhalten. Wir dachten, es wäre eine etwas harte Verkaufsstrategie, nachdem wir dem Team die letzten beiden Monate gesagt hatten: „Verpassen Sie das Datum um keinen Preis!“ Sie verbrachten hunderte Stunden damit, all diese Server aufrecht zu erhalten und wir wussten nicht, wie offen sie gegenüber dieser Veränderung sein würden.
Dennoch brachte Carin, unsere herausragende Managerin der Big Data, das Team zusammen und wir stimmten alle dem Plan zu. Carin stellte die Probleme dar und schlug dann in diesem Ausschnitt den neuen Ansatz vor:
Der neue Plan:
- Höchstens zwei Indizes in AWS betreiben:
- Ein Cluster auf 80 cc2.8xlarge Maschinen – diese sind RIESIG und teurer, aber sollten einen Index in kürzerer Zeit vervollständigen, was diese wiederum über den ganzen Monat billiger macht.
- Falls nötig, ein Backup-Index auf 200 kleineren c1.xlarge Maschinen (derzeitiges Setup) durchführen.
- Arbeiten Sie weiterhin daran, eine Indexgrösse von 60-70 Milliarden URLs aufrechtzuerhalten, um die Verarbeitungszeit im angemessenen Rahmen zu halten.
Dieser Plan gibt der Technik mehr Zeit, die grösseren Probleme anzugehen: Entwickeln Sie ein Testumfeld und verbessern Sie die Mozscape-Code-Basis. Am wichtigsten ist es, dass wir PLDs verteilen können, indem sie effizienter in Bruchteilen verarbeitet werden, was zu deutlichen Verbesserungen in der Zeitersparnis führen könnte.
Zwei Schritte nach vorne
Glücklicherweise wandte Rand diesen Plan an und die Zeit und Energie, die dafür aufgebracht wurden, einen Schritt zurückzugehen, zahlten sich letztlich aus. Neuere, bessere, grössere Ausstattung erledigte den Job ohne Server-Fehler oder betriebliche Kopfschmerzen. Der Index-Release vom Oktober ist das Ergebnis dieser Veränderung. Er war in Rekordzeit fertiggestellt und kostete nur $ 100.000 im Vergleich zu den $ 800.000 vom letzten Monat.
Wir lernten eine Menge Dinge durch diese Erfahrung, aber das war das Wichtigste daran: Die Zeiten, wenn Sie sich fühlen, als hätten Sie keine Zeit, einen Schritt zurückzugehen und erneut nachzuprüfen, sind genau jene Zeiten, in denen es am Notwendigsten wäre. Es mag Ihnen nicht immer $ 700.000 ersparen, aber es besteht zumindest die Chance, dass es so kommen könnte. Die Zeit, die damit verbracht wird, eine neue Sichtweise zu erlangen, kann Lösungen ans Tageslicht bringen, die Sie niemals gesehen hätten, wenn Sie stur weitergearbeitet hätten!
Wir sind voller Hoffnung, dass künftige Indizes so geschmeidig wie im Oktober laufen, und falls das nicht der Fall sein sollte, werden wir uns unseren eigenen Ratschlag zu Herzen nehmen und zuerst einen Schritt zurücktreten, bevor es weiter nach vorne geht.
Englische Quelle: http://www.seomoz.org