Vor Kurzem habe ich einmal diese neue Bibliothek ausprobiert. 1,6 Millionen Romane klang gut, ein paar Tausend mehr als in meiner alten Bücherei und schneller wachsen tat sie in der Vergangenheit auch, was Hoffnung auf Mehr machte. Das Gebäude war nicht schöner oder hässlicher und obwohl die Leute etwas seltsam sprachen, schienen sie doch nett zu sein.
Zum ersten Mal misstrauisch wurde ich, als ich an die Regale trat um ein Buch zu entnehmen. Bei den meisten Romanen handelte es sich mehr um dünne Heftchen als um dicke Bücher – viele Hundert passten in ein Regelfach. Ich zog ein Exemplare heraus und schlug es auf. In großen Lettern fand ich die Geschichte auf einer einzigsten Seite vor: „Held bekämpft Drache, Held rettet Mädchen, Held heirated Mädchen. Ende.“. Nicht gerade ein Thriller. Ich trat zwei Schritte zur Seite und zog ein anderes Buch aus dem Regel. Gleiche Ausmachung, Inhalt diesmal „Held bekämpft Riese, Held rettet Mädchen, Held heirated Mädchen. Ende.“. Drei Versuche später hatte ich gelernt das Helden auch Trolle, Seeungeheuer und böse Magier erschlagen können, aber wirklich unterhaltend waren die Bücher nicht. Auch hatte ich bemerkt das alle Bücher von dem selben Autor geschrieben worden waren – und die Regale schienen noch Tausende seiner Machwerke zu beinhalten.
Ein Stockwerk höher fand ich Bücher eines anderen Autoren, der sich auf Gruselgeschichten spezialisiert zu haben schien und sie zu Tausenden schrieb. Aber außer das die Spukgestalten zwischen Geist, Gespenst, Kobold und einem namenlosen Unheil abwechselten war auch hier wenig Unterhaltendes zu finden.
Bei meinen weiteren Streifzügen durch die Bibliothek stellte ich fest, dass die meisten Bücher von sehr wenigen Autoren geschrieben worden waren und das die gesamte Ausstellungsfläche wesentlich kleiner war als in meiner alten Bücherei. Ab und an fand ich tatsächlich mal ein dickeres Buch oder eine kurze Buchreihe von anderen Autoren, diese gingen aber ziemlich unter und da mein Bedarf an Enttäuschung gedeckt war, lies ich sie stehen.
Ich bin dann wieder zu meiner alten Bücherei gewechselt. Zugegeben, sie ist nicht so groß und wächst auch langsamer. Ab und an fehlen Bücher und es gibt ganze Buchgebiete die nur sehr spärlich abgedeckt sind. Auch in dieser Bibliothek gibt es teilweise sehr dünne Bücher, aber die fallen neben den normalen Werken und dicken Schwarten kaum auf. Und wenn ich hier ein Buch aus dem Regal ziehe, dann werde ich meist unterhalten.
Archive for the ‘Wiki’ Category
1,6M – Eine Parabel
Sunday, June 16th, 2013Toolserver-Status 2011-08
Thursday, August 25th, 2011„Was ist denn eigendlich mit dem Toolserver los? Alles ist langsamer und einige Tools gehen gar nicht“ werde ich in letzter Zeit häufiger gefragt. Ich möchte daher in diesem Beitrag mal die Ereignisse zusammenfassen, die zur jetzigen Situation geführt haben.
Vorgeschichte
Alle Projekte der Wikimedia-Foundation sind in (aktuell) 7 Clustern verteilt (die riesige englischsprachige Wikipedia zum Beispiel konsumiert Cluster 1 komplett, die deutschsprachige Wikipedia ist auf Cluster 5 zusammen mit ein paar kleineren Wikis, commons belegt s4). Jeder Cluster besteht aus einem Master- und mehreren Slave-Datenbankservern. Aktuell hat die Foundation dafür 22 Datenbank-Server im Einsatz. Der Toolserver hat 5 Datenbank-Server.
Nun muss man kein mathematisches Genie sein um zu sehen, dass 5 Server nicht für 7 Cluster ausreichen. Daher spiegeln (replicate) wir die Daten von mehreren Foundation-Servern auf 1 Toolserver-Server. Dieser Prozess krankt an mehreren Stellen; z.B. kann das MySQL eigene Replication-Programm gar nicht von mehreren Master-Servern kopieren, sondern nur von einem. Aus diesem Grund haben wir eigene Programme geschrieben, die die Daten kopieren. Das erzeugt seine ganz eigenen Probleme, auf die ich aber hier nicht näher eingehen will.
Da abzusehen ist, dass der Toolserver nicht im erforderlichen Ausmaß mit weiteren Datenbank-Servern ausgestattet wird (dazu müssten mindestens 9 weitere Server angeschafft werden), gleichzeitig aber die aktuelle Lösung unbefriedigend ist, suchten wir nach Alternativlösungen. Eine Idee dazu war es, mehrere MySQL-Instanzen auf einem Server laufen zu lassen. Um dies zu testen, wurde einer der Datenbank-Server (Hyacinth) von seinen normalen Aufgaben entbunden und von River entsprechend konfiguriert. Hyacinths normale Aufgabe ist es, als Ersatz für Cassia zur Verfügung zu stehen. Cassia trägt die Datenbanken s3, s4, s6 und s7. Nachdem River Hyacinth entsprechen aufgesetzt hatte und die Datenbanken alle wieder neu importiert hatte, begann das Testen.
Ausfall
Am 31. Juli versagte überraschend Cassias Hardware. Nun gab es keinen einsatzbereiten Server für die Cluster s3, s4, s6 und s7 mehr. Wir pflegen eine Kopie von s4 (commons) auf jedem Server, so das dieser Ausfall nicht so kritisch war; s3, s6 und s7 waren aber erstmal weg. Hyacinth befand sich noch im Test-Stadium und ein Rückkehr zum Zustand vor dem Testen war auf die Schnelle nicht machbar. Da wir aber keine Alternative hatten, mussten wir Hyacinth so einsetzen wie er war.
Da mehrere MySQL-Instanzen auf Hyacinth laufen, teilen die sich natürlich auch den Arbeitsspeicher; dieser muss also so verteilt werden, dass keine Instanz die Andere aus den Speicher drängt. Da das Testen auf Hyacinth aber noch nicht abgeschlossen war, tun die Instanzen genau das. Zusätzlich kommt noch ein Bug in MySQL dazu, der jede Instanz mehr Arbeitsspeicher verbrauchen lässt als sie eigentlich darf. Um die maximale Menge zu verändern, die eine Instanz verbrauchen darf, zu verändern muss man sie neu starten. Dann muss man einige Stunden (oder besser einen Tag) warten um zu sehen, wie sich der Speicherbedarf entwickelt; das Alles dauert einfach und Alles ist langsamer.
Weiterhin verfügt Hyacinth nicht über genügt Festplatten und Festplattenplatz um alle Datenbank-Instanzen aufnehmen zu können; der kleinste und neuste Cluster (s7) musste daher teilweise mit einem externen Festplattenarray vorlieb nehmen. Ob das ein Problem ist, sollte eigentlich das Testen zeigen.
Ein weiteres Problem betraf das Aufteilen an sich. River hatte bereits 22. Juni die Toolautoren gebeten, zu benennen welche Benutzer-Datenbanken auf welche Instanz gehören. Im alten Setup (also als s3, s4, s6 und s7 in einer Instanz zusammen waren) gab war es egal ob die Toolautoren sich zu s3 oder zu s4 verbanden – ihre Benutzer-Datenbank war da. Durch das Aufteilen macht es aber einen Unterschied ob man sich zu s3 oder zu s4 verbindet; Datenbanken sie auf s3 liegen sind in s4 nicht da. Die Resonanz der Toolautoren war eher verhalten und so wurden 99% der Benutzerdatenbanken auf s3 eingerichtet. Das war erstmal kein Problem, da die Toolautoren ja zumeist Cassia nutzen und so gar nicht merkten, dass es irgendwann auf Hyacinth (nach Ende des Tests) ein Problem geben würde. Nach Cassias Ausfall wurde das Problem aber akut; Tools die eine Benutzerdatenbank auf s4 (commons) benötigen können diese nicht mehr finden, denn sie liegt auf s3. Das ist der Grund für den Ausfall vieler Tools. Es wird einige Zeit dauern, bis die Toolautoren ihren Code angepasst haben.
Ich hoffe, ihr versteht nun etwas Besser, warum der Toolserver (für gewisse) Tools langsamer ist als sonst und warum einige Tools nicht funktionieren. Für Rückfragen könnt ihr gerne die Kommentarfunktion benutzten oder mich im Chat ansprechen.
Hauptamtliche Hilfe für den TS
Friday, February 5th, 2010Der Toolserver hat nun einen bezahlten hauptamtlichen Admin — River Tarnell. River ist der Senior-Admin des Toolservers und seit Anfang an dabei. Möge die weitere Zusammenarbeit genauso gut laufen, wie bisher
.
Leider wurde von Seiten des Vereins mal wieder verschlafenvergessen, die Kollegen vorher zu informieren.
Wer schreibt eigendlich neue Artikel?
Tuesday, January 5th, 2010Vor einigen Tagen kam im Chat eine Diskussion um die Mitarbeitersituation auf. Teil der Diskussion war auch die Frage, wer denn die neuen Artikel schreibt — die Regulars oder auch neue Autoren? Gestern Abend hab’ mich mir die Frage nochmal vorgenommen und die Datenbank auf dem Toolserver gequält. Folgendes Ergebnis war heute Mittag herausgekommen:
| Anmeldejahr | Neue Artikel in 2010 |
|---|---|
| Vor 2006* | 607 |
| 2006 | 401 |
| 2007 | 222 |
| 2008 | 202 |
| 2009 | 315 |
| 2010 | 116 |
Die erste Spalte gibt das Anmeldejahr der Benutzer aus, die Zweite die Anzahl der neuen Artikel in 2010; d.h. zum Beispiel das 222 neue Artikel von Benutzern geschrieben wurden, die sich irgendwann 2007 angemeldet haben. Die Abfrage berücksichtigte nur bestehende Artikel — also sind diejenigen die schon gelöscht wurden nicht mit erfasst (solche die momentan einen LA haben, aber schon). Nicht erfasst sind auch Artikelneuanlagen von anonymen Autoren.Update 1: Insgesamt wurden 2096 neue Artikel angelegt, das bedeutet, dass 233 von anonymen Autoren sind.
Ich persönlich finde besonders faszinierend, dass bereits 116 von ganz neuen Benutzern angelegt worden sind — ansonsten sehe ich eine recht gleichmäßige Verteilung über die Jahre.
H-stt fragte nach der Verteilung des Edits generell. Nachfolgende Tabelle zeigt dies. Die erste Spalte zeigt wieder das Anmeldejahr, die Zweite die Anzahl der Edits im Artikelnamesraum ab Beginn des Jahres bis 5. Januar 5:32 MEZ (das Datum der obigen Abfrage).
| Anmeldejahr | Bearbeitungen in 2010 |
|---|---|
| Vor 2006* | 27395 |
| 2006 | 16682 |
| 2007 | 13414 |
| 2008 | 14109 |
| 2009 | 11930 |
| 2010 | 1853 |
Mofis
Friday, November 20th, 2009Der Verein Missbrauchsopfer für Internetsperren (kurz MoFIs) ist ein im Frühling 2009 gegründeter Verein, der sich für Internetsperren ausspricht. Erklärtes Fernziel ist es, dass zukünftig nur noch Internetseiten angesteuert werden könne, die auf einer von der Regierung absegneten Whiteliste zu finden sind. Dadurch soll den Opfern sexuellen Missbrauches optimal geholfen bzw. neuer Missbrauch effektiv verhindert werden.
Dieses Ziel versucht der Verein durch Lobbing und Ausrufe zu Demonstrationen zu erreichen. Nach eigener Aussage kämpft der Verein dabei auch gegen Hacker und gegen Anonymisierungsprogramme, da diese ihrem Fernziel im Wege stehen würden.
Der Verein rief mehrmals erfolgreich zu Demonstrationen für die von der Regierung angeregten Internetsperren auf und führte – nach eigenen Angaben – erfolgreiche Spendensammlungen durch.
Erster Vorsitzender und gleichzeitig einiges bekanntes Mitglied ist der als radikale Kinderschützer bekannte Toru Lethe Mall, der auch mehrfach in Magazinen kleineren Fernsehsender zu Gast war. Der Verein versichert jedoch, über mehrere Dutzend Mitglieder zu verfügen.
Mich würde wirklich interresieren, ob die Blogosphäre für diesen Artikel auch so gekämpft hätte….
Goodbye, and thanks for all the code
Tuesday, September 29th, 2009Brion Vibber, unser Chefentwickler und CTO der Foundation, wird uns verlassen. Er wechselt zu StatusNet, dem Betreiber hinter identi.ca.
Obwohl uns Brion laut seinem Blogeintrag als Entwickler erhalten bleiben wird, möchte ich an dieser Stelle meinen Dank zum Ausdruck bringen: Danke für deine Gelassenheit auch in hektischen Situation und für all den Code
.
Sysadmintag 2009
Friday, July 31st, 2009Zum heutigen Syadmin-Tag danke an alle die Sysadmins, die direkt oder indirekt dafür sorgen, dass die Wikimedia-Projekte ihren Dienst mehr oder weniger zuverlässig tun.
DANKE!
.
Neues vom Toolserver
Wednesday, July 29th, 2009In den letzten Tagen und Wochen gab es einige Veränderungen auf dem Toolserver, von denen ich hier kurz berichten möchte.
Zunächst mal haben wir den Account-Accepting (also das Zugangs-Genehmigungsverfahren) überarbeitet und beschleunigt. In der Vergangen kam es vor, dass Leute monatelang auf ihren Zugang warten mussten, weil es eine Weile dauerte bis ich den Antrag bemerkte, Zeit fand um rückzufragen, der User das nicht bemerkte, ich eine Zeit braucht um zu bemerken, dass er geantwortet hatte, dann gerade keine Hardware da war (ok, das löst das neue Verfahren auch nicht
) und so weiter.
Zukünftig benutzen wir einen festgelegten Arbeitsablauf. Dafür ist das ganze nach JIRA – unserem Fehlerbenachrichtigungsystem – umgezogen. Läuft bis jetzt sehr gut an, auch wenn es noch Optimierungspotenzial gibt.
Zweitens hat uns die Foundation Geld zur Verfügung gestellt um weitere Datenbankserver zu kaufen. Dies soll die Stabilität erhöhen. Daniel Kinzler berichtet hier ausführlich.
Außerdem haben wir, nachdem die stabilen Projekte nicht so recht zünden, uns eine neue Strategie überlegt wie man Leute motivieren kann, Tools zusammen zu entwickeln. Dafür haben wir „multi-maintainer tool“s eingeführt. Der Prozess ist weniger aufwändig wie ein stabiles Projekt, man kann auch alleine ein multi-maintainer-tool beginnen, und es läuft auf dem normalen Toolserver. Hier (en) finden sich weitere Details dazu.
Abschließend soll der Web-Server von Debian auf Solaris umziehen. Aktuell befinden wir uns dazu in einer Testphase. Wer beim Testen helfen möchte, kann einfach http://toolserver.org durch http://willow.toolserver.org ersetzen (aus http://toolserver.org/~daniel/WikiSense/Gallery.php wird also http://willow.toolserver.org/~daniel/WikiSense/Gallery.php). Die Toolautoren freuen sich sicher über Rückmeldungen.
Toolserverausfall
Thursday, May 28th, 2009Auf Grund eines unbekannten Netzwerkproblems ist der komplette Toolservercluster (mit Ausnahme des Servers Amaranth) momentan offline. Aktuell kann nicht abgeschätzt werden, wann der Schaden repariert sein wird.
Update:Der Toolserver steht wieder zur Verfügung. Problem war wohl ein defekter Port am Switch.
Die Zukunft?
Saturday, April 18th, 2009In naher Zukunft:
X-Dorf
- aus Wikipedia, der freien Enzyklopädie
- Hauptautoren: Vielschreiber1, Historiker7, Heimatkundler65, Student5, Laberrer303
- Ohne die folgenden Lektoren und Korrekturen würde dieser Artikel immer noch von Fehlern wimmeln: Lektor37, AlterRechtschreibler56, NeuerRechtschreibler43.
- Ohne die folgenden Bots wäre eine Verlinkung in andere Sprachen und weiteres automatisches Bearbeiten nicht möglich gewesen: Bot2, Linkbot5, Interbot3, Typobot5.
- Danke auch an die folgenden Administratoren, die diesen Artikel vor Trollen/Vandalen/Spammern beschützt haben: RCler76, Sperradmin23.
- Wir danken weiterhin der Wikimedia Foundation, das sie die dieses Projekt hostet, namentlich für das Board: WichtigerBenutzer7, Urgestein6, Gründer5.
- Sowie den zahlreichen Chaptern – besonders Wikimedia Deutschland – für die finanzielle und moralische Unterstützung beim Aufbau dieses Artikels sowie der Interessensgemeinschaft der Wikipedia-AutorInnen für das Durchsetzen von Autorenrechten gegenüber jederman
X-Dorf ist ein Dorf im nordöstlichen X-Land.