Toolserver-Status 2011-08

August 25th, 2011

„Was ist denn eigendlich mit dem Toolserver los? Alles ist langsamer und einige Tools gehen gar nicht“ werde ich in letzter Zeit häufiger gefragt. Ich möchte daher in diesem Beitrag mal die Ereignisse zusammenfassen, die zur jetzigen Situation geführt haben.

Vorgeschichte
Alle Projekte der Wikimedia-Foundation sind in (aktuell) 7 Clustern verteilt (die riesige englischsprachige Wikipedia zum Beispiel konsumiert Cluster 1 komplett, die deutschsprachige Wikipedia ist auf Cluster 5 zusammen mit ein paar kleineren Wikis, commons belegt s4). Jeder Cluster besteht aus einem Master- und mehreren Slave-Datenbankservern. Aktuell hat die Foundation dafür 22 Datenbank-Server im Einsatz. Der Toolserver hat 5 Datenbank-Server.
Nun muss man kein mathematisches Genie sein um zu sehen, dass 5 Server nicht für 7 Cluster ausreichen. Daher spiegeln (replicate) wir die Daten von mehreren Foundation-Servern auf 1 Toolserver-Server. Dieser Prozess krankt an mehreren Stellen; z.B. kann das MySQL eigene Replication-Programm gar nicht von mehreren Master-Servern kopieren, sondern nur von einem. Aus diesem Grund haben wir eigene Programme geschrieben, die die Daten kopieren. Das erzeugt seine ganz eigenen Probleme, auf die ich aber hier nicht näher eingehen will.
Da abzusehen ist, dass der Toolserver nicht im erforderlichen Ausmaß mit weiteren Datenbank-Servern ausgestattet wird (dazu müssten mindestens 9 weitere Server angeschafft werden), gleichzeitig aber die aktuelle Lösung unbefriedigend ist, suchten wir nach Alternativlösungen. Eine Idee dazu war es, mehrere MySQL-Instanzen auf einem Server laufen zu lassen. Um dies zu testen, wurde einer der Datenbank-Server (Hyacinth) von seinen normalen Aufgaben entbunden und von River entsprechend konfiguriert. Hyacinths normale Aufgabe ist es, als Ersatz für Cassia zur Verfügung zu stehen. Cassia trägt die Datenbanken s3, s4, s6 und s7. Nachdem River Hyacinth entsprechen aufgesetzt hatte und die Datenbanken alle wieder neu importiert hatte, begann das Testen.

Ausfall
Am 31. Juli versagte überraschend Cassias Hardware. Nun gab es keinen einsatzbereiten Server für die Cluster s3, s4, s6 und s7 mehr. Wir pflegen eine Kopie von s4 (commons) auf jedem Server, so das dieser Ausfall nicht so kritisch war; s3, s6 und s7 waren aber erstmal weg. Hyacinth befand sich noch im Test-Stadium und ein Rückkehr zum Zustand vor dem Testen war auf die Schnelle nicht machbar. Da wir aber keine Alternative hatten, mussten wir Hyacinth so einsetzen wie er war.
Da mehrere MySQL-Instanzen auf Hyacinth laufen, teilen die sich natürlich auch den Arbeitsspeicher; dieser muss also so verteilt werden, dass keine Instanz die Andere aus den Speicher drängt. Da das Testen auf Hyacinth aber noch nicht abgeschlossen war, tun die Instanzen genau das. Zusätzlich kommt noch ein Bug in MySQL dazu, der jede Instanz mehr Arbeitsspeicher verbrauchen lässt als sie eigentlich darf. Um die maximale Menge zu verändern, die eine Instanz verbrauchen darf, zu verändern muss man sie neu starten. Dann muss man einige Stunden (oder besser einen Tag) warten um zu sehen, wie sich der Speicherbedarf entwickelt; das Alles dauert einfach und Alles ist langsamer.
Weiterhin verfügt Hyacinth nicht über genügt Festplatten und Festplattenplatz um alle Datenbank-Instanzen aufnehmen zu können; der kleinste und neuste Cluster (s7) musste daher teilweise mit einem externen Festplattenarray vorlieb nehmen. Ob das ein Problem ist, sollte eigentlich das Testen zeigen.
Ein weiteres Problem betraf das Aufteilen an sich. River hatte bereits 22. Juni die Toolautoren gebeten, zu benennen welche Benutzer-Datenbanken auf welche Instanz gehören. Im alten Setup (also als s3, s4, s6 und s7 in einer Instanz zusammen waren) gab war es egal ob die Toolautoren sich zu s3 oder zu s4 verbanden – ihre Benutzer-Datenbank war da. Durch das Aufteilen macht es aber einen Unterschied ob man sich zu s3 oder zu s4 verbindet; Datenbanken sie auf s3 liegen sind in s4 nicht da. Die Resonanz der Toolautoren war eher verhalten und so wurden 99% der Benutzerdatenbanken auf s3 eingerichtet. Das war erstmal kein Problem, da die Toolautoren ja zumeist Cassia nutzen und so gar nicht merkten, dass es irgendwann auf Hyacinth (nach Ende des Tests) ein Problem geben würde. Nach Cassias Ausfall wurde das Problem aber akut; Tools die eine Benutzerdatenbank auf s4 (commons) benötigen können diese nicht mehr finden, denn sie liegt auf s3. Das ist der Grund für den Ausfall vieler Tools. Es wird einige Zeit dauern, bis die Toolautoren ihren Code angepasst haben.

Ich hoffe, ihr versteht nun etwas Besser, warum der Toolserver (für gewisse) Tools langsamer ist als sonst und warum einige Tools nicht funktionieren. Für Rückfragen könnt ihr gerne die Kommentarfunktion benutzten oder mich im Chat ansprechen.

Hauptamtliche Hilfe für den TS

February 5th, 2010

Der Toolserver hat nun einen bezahlten hauptamtlichen Admin — River Tarnell. River ist der Senior-Admin des Toolservers und seit Anfang an dabei. Möge die weitere Zusammenarbeit genauso gut laufen, wie bisher :-) .

Leider wurde von Seiten des Vereins mal wieder verschlafenvergessen, die Kollegen vorher zu informieren.

Quelle.

Wer schreibt eigendlich neue Artikel?

January 5th, 2010

Vor einigen Tagen kam im Chat eine Diskussion um die Mitarbeitersituation auf. Teil der Diskussion war auch die Frage, wer denn die neuen Artikel schreibt — die Regulars oder auch neue Autoren? Gestern Abend hab’ mich mir die Frage nochmal vorgenommen und die Datenbank auf dem Toolserver gequält. Folgendes Ergebnis war heute Mittag herausgekommen:

Anmeldejahr Neue Artikel in 2010
Vor 2006* 607
2006 401
2007 222
2008 202
2009 315
2010 116
Die Anmeldedaten wurden erst im Laufe des Jahres 2005 gespeichert.

Die erste Spalte gibt das Anmeldejahr der Benutzer aus, die Zweite die Anzahl der neuen Artikel in 2010; d.h. zum Beispiel das 222 neue Artikel von Benutzern geschrieben wurden, die sich irgendwann 2007 angemeldet haben. Die Abfrage berücksichtigte nur bestehende Artikel — also sind diejenigen die schon gelöscht wurden nicht mit erfasst (solche die momentan einen LA haben, aber schon). Nicht erfasst sind auch Artikelneuanlagen von anonymen Autoren.Update 1: Insgesamt wurden 2096 neue Artikel angelegt, das bedeutet, dass 233 von anonymen Autoren sind.

Ich persönlich finde besonders faszinierend, dass bereits 116 von ganz neuen Benutzern angelegt worden sind ­— ansonsten sehe ich eine recht gleichmäßige Verteilung über die Jahre.

Update 1
H-stt fragte nach der Verteilung des Edits generell. Nachfolgende Tabelle zeigt dies. Die erste Spalte zeigt wieder das Anmeldejahr, die Zweite die Anzahl der Edits im Artikelnamesraum ab Beginn des Jahres bis 5. Januar 5:32 MEZ (das Datum der obigen Abfrage).

Anmeldejahr Bearbeitungen in 2010
Vor 2006* 27395
2006 16682
2007 13414
2008 14109
2009 11930
2010 1853

Mofis

November 20th, 2009

Der Verein Missbrauchsopfer für Internetsperren (kurz MoFIs) ist ein im Frühling 2009 gegründeter Verein, der sich für Internetsperren ausspricht. Erklärtes Fernziel ist es, dass zukünftig nur noch Internetseiten angesteuert werden könne, die auf einer von der Regierung absegneten Whiteliste zu finden sind. Dadurch soll den Opfern sexuellen Missbrauches optimal geholfen bzw. neuer Missbrauch effektiv verhindert werden.
Dieses Ziel versucht der Verein durch Lobbing und Ausrufe zu Demonstrationen zu erreichen. Nach eigener Aussage kämpft der Verein dabei auch gegen Hacker und gegen Anonymisierungsprogramme, da diese ihrem Fernziel im Wege stehen würden.
Der Verein rief mehrmals erfolgreich zu Demonstrationen für die von der Regierung angeregten Internetsperren auf und führte – nach eigenen Angaben – erfolgreiche Spendensammlungen durch.
Erster Vorsitzender und gleichzeitig einiges bekanntes Mitglied ist der als radikale Kinderschützer bekannte Toru Lethe Mall, der auch mehrfach in Magazinen kleineren Fernsehsender zu Gast war. Der Verein versichert jedoch, über mehrere Dutzend Mitglieder zu verfügen.

Mich würde wirklich interresieren, ob die Blogosphäre für diesen Artikel auch so gekämpft hätte….

Goodbye, and thanks for all the code

September 29th, 2009

Brion Vibber, unser Chefentwickler und CTO der Foundation, wird uns verlassen. Er wechselt zu StatusNet, dem Betreiber hinter identi.ca.
Obwohl uns Brion laut seinem Blogeintrag als Entwickler erhalten bleiben wird, möchte ich an dieser Stelle meinen Dank zum Ausdruck bringen: Danke für deine Gelassenheit auch in hektischen Situation und für all den Code :-) .

Sysadmintag 2009

July 31st, 2009

Zum heutigen Syadmin-Tag danke an alle die Sysadmins, die direkt oder indirekt dafür sorgen, dass die Wikimedia-Projekte ihren Dienst mehr oder weniger zuverlässig tun.

DANKE! :-) .

Neues vom Toolserver

July 29th, 2009

In den letzten Tagen und Wochen gab es einige Veränderungen auf dem Toolserver, von denen ich hier kurz berichten möchte.

Zunächst mal haben wir den Account-Accepting (also das Zugangs-Genehmigungsverfahren) überarbeitet und beschleunigt. In der Vergangen kam es vor, dass Leute monatelang auf ihren Zugang warten mussten, weil es eine Weile dauerte bis ich den Antrag bemerkte, Zeit fand um rückzufragen, der User das nicht bemerkte, ich eine Zeit braucht um zu bemerken, dass er geantwortet hatte, dann gerade keine Hardware da war (ok, das löst das neue Verfahren auch nicht ;-) ) und so weiter.
Zukünftig benutzen wir einen festgelegten Arbeitsablauf. Dafür ist das ganze nach JIRA – unserem Fehlerbenachrichtigungsystem – umgezogen. Läuft bis jetzt sehr gut an, auch wenn es noch Optimierungspotenzial gibt.

Zweitens hat uns die Foundation Geld zur Verfügung gestellt um weitere Datenbankserver zu kaufen. Dies soll die Stabilität erhöhen. Daniel Kinzler berichtet hier ausführlich.

Außerdem haben wir, nachdem die stabilen Projekte nicht so recht zünden, uns eine neue Strategie überlegt wie man Leute motivieren kann, Tools zusammen zu entwickeln. Dafür haben wir „multi-maintainer tool“s eingeführt. Der Prozess ist weniger aufwändig wie ein stabiles Projekt, man kann auch alleine ein multi-maintainer-tool beginnen, und es läuft auf dem normalen Toolserver. Hier (en) finden sich weitere Details dazu.

Abschließend soll der Web-Server von Debian auf Solaris umziehen. Aktuell befinden wir uns dazu in einer Testphase. Wer beim Testen helfen möchte, kann einfach http://toolserver.org durch http://willow.toolserver.org ersetzen (aus http://toolserver.org/~daniel/WikiSense/Gallery.php wird also http://willow.toolserver.org/~daniel/WikiSense/Gallery.php). Die Toolautoren freuen sich sicher über Rückmeldungen.

Toolserverausfall

May 28th, 2009

Auf Grund eines unbekannten Netzwerkproblems ist der komplette Toolservercluster (mit Ausnahme des Servers Amaranth) momentan offline. Aktuell kann nicht abgeschätzt werden, wann der Schaden repariert sein wird.

Update:Der Toolserver steht wieder zur Verfügung. Problem war wohl ein defekter Port am Switch.

Die Zukunft?

April 18th, 2009

In naher Zukunft:

X-Dorf

  • aus Wikipedia, der freien Enzyklopädie
  • Hauptautoren: Vielschreiber1, Historiker7, Heimatkundler65, Student5, Laberrer303
  • Ohne die folgenden Lektoren und Korrekturen würde dieser Artikel immer noch von Fehlern wimmeln: Lektor37, AlterRechtschreibler56, NeuerRechtschreibler43.
  • Ohne die folgenden Bots wäre eine Verlinkung in andere Sprachen und weiteres automatisches Bearbeiten nicht möglich gewesen: Bot2, Linkbot5, Interbot3, Typobot5.
  • Danke auch an die folgenden Administratoren, die diesen Artikel vor Trollen/Vandalen/Spammern beschützt haben: RCler76, Sperradmin23.
  • Wir danken weiterhin der Wikimedia Foundation, das sie die dieses Projekt hostet, namentlich für das Board: WichtigerBenutzer7, Urgestein6, Gründer5.
  • Sowie den zahlreichen Chaptern – besonders Wikimedia Deutschland – für die finanzielle und moralische Unterstützung beim Aufbau dieses Artikels sowie der Interessensgemeinschaft der Wikipedia-AutorInnen für das Durchsetzen von Autorenrechten gegenüber jederman

X-Dorf ist ein Dorf im nordöstlichen X-Land.

Frei?

August 14th, 2008

Auf der Mailingliste gibt es gerade eine Diskussion zum Thema Lizenzen und Lizenzverstöße; und zwar nicht darum, ob wir gegen Lizenzen verstoßen, sondern um Leute, die gegen unsere Lizenzen verstoßen. Nun möchte auch ich dazu mal meine Gedanken niederschreiben.
Für mich bezog und bezieht sich das “frei” in “freie Enzyklopädie” schon immer mehr auf Bier wie auf Rede. Das, was unser Werk für mich so wertvoll macht, ist die freie Verwendbarkeit; also das jemand seinen Browser startet und schnell was nachlesen kann. Wenn das zufrieden funktioniert hat, dann bin ich zufrieden. Mir geht es nicht darum, das jemand mitbekommt, das ich das geschrieben habe. Hätte die Wikipedia eine Lizenz, die alle Beiträge gemeinfrei stellen würde, würde ich trotzdem mitmachen.
Das Gleiche gilt für mich, wenn jemand den Text weiterverwendet. Bei einem gedruckten Großwerken wie Büchern reicht es mir völlig, wenn mein Name irgendwo am Ende des Buches unter “Autoren der Beiträge” steht; auch eine Quellenangabe “aus der Wikipedia” bei kurzen Textübernahmen reicht mir völlig; und ein Weblink auf den Wikipedia-Artikel bei einer Online-Weiternutzung auch.
Ich arbeite hier mit um Leuten weiterzuhelfen. Ich will nicht Leute lizenztechnisch erziehen oder meine persönliche Eitelkeit stärken. Das Wissen soll frei sein und verbreitet; und wenn jemand – wie im aktuellen Fall – Wikipediatexte nimmt und auf CD spricht, dann ist das eine Verbreitung, die uns allen nutzt: Weitere Personen profitieren von unserer Arbeit. Und wenn der Verein am Ende noch 3,50€ für die Logonutzung bekommt: um so besser.
Mir ist überhaupt nicht geholfen, wenn die beiden längsten Tracks auf der CD am Ende “Autorennamenvorlesen” und “Lizenztextvorlesen” heißen. Und wenn jetzt Leute hingehen und sagen “aber die Sprachaufnahmen sind nun auch GNU FDL und müssen uns daher überlassen werden”, so Gewinnen wir ein paar Audio-Dateien; der Verlag wird aber daraus lernen und nie wieder eine solche CD verfassen – damit ist dann auch die Weiterverbreitung futsch.
Auf der Mailingliste wurden auch die Klagen von Linux-Tools- bzw -Kernel-Entwickler gegen Hardwarehersteller angesprochen. Meiner Meinung nach kann man das nicht mit uns vergleichen. Den Entwicklern geht es zumeist darum, Information über die Hardware zu bekommen – einfach weil die Hardwarehersteller damit ungern rausrücken – um ihre Software daran anzupassen. Wer sich die “Linux läuft auf meinem Toaster”-Wettbewerbe ansieht, wird mich verstehen. Wir sind aber nicht darauf angewiesen, Informationen über Hardware zu erhalten. Wikipedia läuft im Web und gut ist. Wenn es jemand wo anders drauf laufen lassen möchte (Intranet, CD/DVD, Buch, Handy, etc. pp.) dann muss er sich darum kümmern. Und meiner Meinung nach sollte man ihm dabei so wenig Steine wie möglich in den Weg legen.

Und nun macht mich rot ;)