Hallo liebe Community,
wie euch sicher nicht entgangen ist, gibt es seit dem letzten Update auf die aktuelle Version v0.19 von Lemmy einige Probleme. Dies betrifft hauptsächlich zwei Bereiche:
- die Föderation
- häufige Fehlermeldungen
Der erste Punkt sollte eigentlich mit dem Update auf v0.19.1 behoben werden, was aber nicht ganz den gewünschten Effekt zeigt. Im Moment scheinen alle Beiträge nur einmal am Tag auf andere Instanzen gepusht zu werden.
Das zweite Problem wurde mit dem Update noch nicht behoben, ist aber den Entwicklern bekannt, besteht aber weiterhin. Einige Apps scheinen client-seitige Maßnahmen zu implementieren, die diese Fehler unterdrücken oder einfach ignorieren, z.B. Voyager (Download-Links sind auf deren GitHub-Seite zu finden, aber es kann sein, dass die Versionen in den App Stores das Update noch nicht bereitstellen).
Leider können wir auch nicht einfach ein Downgrade auf 0.18.5 durchführen, da Lemmy keine Unterstützung für die Migration der Datenbank auf eine frühere Version bietet. Und da viele von euch bereits ihre 2FA und Passwörter aktualisiert haben und seitdem viele Beiträge geschrieben wurden, wollen wir auch nicht das Backup von vor dem Update einspielen.
Ich verstehe, dass dies im Moment nicht sehr angenehm ist und möchte mich für die Unannehmlichkeiten entschuldigen.
- Update 2023-12-31: Informationen zum Ausfall am 29/30.12.2023 gibt es hier.
- Update 2024-01-03: Die Föderationsprobleme scheinen trotz Fix nicht gelöst zu sein und funktioniert nur sporadisch, wenn überhaupt.
- Update 2024-01-11: Eine neue Version wurde eingespielt, welche die Probleme beheben sollte. Es kann noch etwas dauern bis der Server die aufgestauten Beiträge auf die anderen Server synchronisiert.
Gebt gerne Bescheid, falls weiterhin Probleme auftreten.
Braucht euch doch nicht dafür entschuldigen. Einerseits könnt ihr weder was dafür noch dagegen, und andererseits bietet ihr hier eine kostenlose Platform an. Selbst wenn es durch euch verursacht gewesen wäre, dürfte sich hier keiner darüber aufregen.
Immerhin schuldet ihr uns nichts, sondern wir euch.
Vielen Dank für eure tolle Arbeit, und vielen Dank, dass ihr das einfach so als Service für die Allgemeinheit anbietet!
Eine Entschuldigung ist trotzdem eine nette und gute Geste, die Zuversicht bestärkt dass die Führung Interesse an einer stabilen Plattform hat.
Die Plattform lebt von und mit Stabilität. Ohne wäre feddit nicht groß geworden.
Nachdem dies das zweite Mal ist mit mehrtägigen schwerwiegenden Problemen nach einem Versionsupgrade hoffe ich man ist da zukünftig vorsichtiger und wartet mindestens ein paar Tage oder Patch Release ab nach neuen feature releases. Denn dass man sich darauf vom Lemmy Projekt nicht verlassen kann sollte nun offensichtlich sein.
Es gibt wohl einen Fix, der auf lemm.ee das Problem mit der Föderation behoben hat. Vor 2h meinte einer der Entwickler, dass der zeitnah raus geht. Hoffen wir mal das Beste https://github.com/LemmyNet/lemmy/issues/4288#issuecomment-1879052639
Oh das sind hervorragend Neuigkeiten!
0.19.2 kam gerade raus @nachtigall
Patch ist eingespielt…
Die Fehlermeldungen bleiben.
Das kostet uns gerade wirklich Reputation und Benutzer.
Gut möglich, dass die fehlerhafte Föderation eine erhöhte Last und damit diese Fehler verursacht hat. Hab noch nicht die Zeit gehabt genau zu verfolgen, was in der neuen Version alles geändert wurde. Aber es gab zuletzt in irgendeinem Issue Diskussionen darüber, ob man die Ressourcen der Federation-Queue deckeln sollte, damit einkommende http-Requests zeitnah beantwortet werden können. Anscheinend haben die bisher keine höhere Priorität und müssen sich hinten anstellen.
Die feddit.de-Federation-Queue dürfte gerade noch sehr lang sein, sodass die Last durch das Abarbeiten des Backlogs aktuell noch sehr hoch sein dürfte. Also erstmal abwarten, ob die Fehler in den kommenden Tagen bestehen bleiben.
So war’s tatsächlich.
Also Fehlermeldungen habe ich jetzt keine mehr bekommen. Es ist zwar gerade ein wenig langsam mit manchen Sachen, aber das dürfte, wie @wgbirne schon sagte, daran liegen, dass die Federation-Queue jetzt vom Server abgearbeitet werden muss.
Ich bekomme, wie die letzten Wochen auch, so viele Timeouts, dass es kaum Spaß macht. Vielleicht läuft die Queue ja noch und es wird besser…
Also nachdem der Patch jetzt mehrere Stunden online ist, hab ich bisher 0 Fehlermeldungen erhalten. Insgesamt fühlt es sich sehr geschmeidig an und läuft vielleicht besser als je zuvor.
Zusatzinfo: ich nutze lemmy ausschließlich mit Jerboa.
Ich nutze lemmy auch am PC und ich sehe hier hin und wieder mal eine Fehlermeldung auf dem zweiten Bildschirm aufploppen. Hin und wieder hat er wohl noch Schluckauf, aber es läuft doch schon deutlich geschmeidiger als vor dem Update.
Nur das mit der Föderation scheint noch immer nicht so ganz zu klappen. Zumindest sehe ich keine neuen Posts oder Kommentare, wenn ich den Haupteingang über lemmy.world/c/main@feddit.de anschaue. Und bei diesem ich_iel Pfosten sind unsere Kommentare leider auch nicht zu sehen.
@nachtigall damit ihr da vielleicht auch noch ein Auge drauf habt.Behalten wir im Auge. Aber wie wgbirne schon geschrieben hat, wird das sicher eine Weile dauern bis der fast 3-wöchige Backlog abgearbeitet ist.
Oh, das ging aber fix. Die ersten Posts hier aus dem Haupteingang kann ich auf lemmy.world schon sehen. Bin mal gespannt wann und ob der ganze backlog noch durchföderiert wird.
So oder so, wieder einmal vielen Dank für eure Arbeit, liebe Admins. O7
Danke für die Kommunikation und das administrieren, frohe Weihnachten und guten Rutsch an alle!
Easy Leute - das wird schon wieder 👍
Danke vielmals für den tolle Service und auch für die Kommunikation. (sowas würde ich mir von etablierten Firmen auch mal wünschen)
Danke für die regelmäßigen Updates und allgemein für eure Arbeit.
Wenn es Möglichkeiten gibt, euch zu unterstützen, könnt ihr die auch gerne äußern. (oder schreiben, wo die zu finden sind)
Wenn alle freundlich und respektvoll bleiben ist schon vieles getan 🫶
Wer den ein oder anderen Pfennig über hat, kann natürlich an die Entwickler spenden, damit diese weiterhin in Vollzeit an Lemmy arbeiten können: https://join-lemmy.org/donate
Also alles beim Alten. 🫡
Na dann wünsche ich eben noch ein frohes Fest.
feddit.de ist die einzige Instanz die ich finde, die hier (https://phiresky.github.io/lemmy-federation-state/site?domain=feddit.de) “0 dead instances” anzeigt. Instanzen die bei anderen “dead” sind, werden bei feddit.de unter “failed” angezeigt. Kann es sein dass feddit.de hier doch ein eigenes Problem hat? Vielleicht gibt es da ständig Timeouts bei der Federation weil versucht wird tote Instanzen zu kontaktieren?
Bei lemmy.ml sieht das ganz anders aus…: https://phiresky.github.io/lemmy-federation-state/site?domain=lemmy.ml
Edit: @wintermute@feddit.de Wobei es ja jetzt nach dem Upscaling wieder sauber zu laufen scheint, woohoo! :)
Mittlerweile bezweifel ich ein bisschen, dass die Probleme nur an der neuen Lemmy-Version liegen. Wenn ich auf https://lemmy.ml surfe, dann scheine ich nicht mal im Ansatz die Probleme zu haben, die ich auf https://feddit.de habe und die sind auch auch 0.19.1.
Seit ihr ganz sicher, dass das wirklich nur an der Version liegt?
Es gibt halt keine Anhaltspunkte, woran es sonst liegen könnte. Ich hatte ja die Vermutung, dass die DB immer abgeschossen wird wegen zu wenig CPU/RAM, aber die Auslastung spricht dagegen. Lemm.ee und anderen kleinere Instanzen auf 0.19.x geht es aber auch wie uns, was wiederum für Probleme im Code spricht. Es ist sehr frustrierend im Moment.
Wenn man sich den Statusmonitor mal anschaut, dann fällt stark auf, dass die Seite so ca. alle 15 Minuten offline geht. Und zwar auch erstaunlich regulär, ich hab es jetzt nicht den ganzen Tag sauber geloggt, aber die Uhrzeiten scheinen immer ähnlich zu sein. Das würde auf einen irgendwie komisch laufenden Cronjob hinweisen, der alle 15 Minuten feuert.
Danke für die Info.
Wenn es hilft: Ich hatte heute Nachmittag einmal unter den unzähligen Fehlermeldungen/Hängern eine, die sagte, dass die Instanz gerade neu gestartet wird. Wenn ihr das nicht selbst wart, ist das vielleicht ein Anhaltspunkt.
Da hatte ich auch schon eine. Der Gedanke dass die häufige Nicht-Erreichbarkeit an einem Restart-Loop oder so etwas liegt ist mir auch schon gekommen.
Wo du lemm.ee ansprichst, ich habe gesehen, dass bei denen die Föderation wieder funktioniert. Link zu deren Post dazu.
Deren Admin dort hat wohl was an der Infrastruktur im Hintergrund geändert und die Software nochmal selbst etwas gepatcht. Der ist aber wohl auch Contributor zur Lemmy Codebase. Ich weiß ja nicht wie sehr ihr da drin steckt, aber ich unterstelle jetzt einfach mal, dass es wohl besser ist nicht selbst daran rumzufrickeln und zu warten bis es einen neuen Patch gibt.
Auf sopuli.xyz kam von feddit.de in den letzten Tagen gar nichts :(
Siehe z.B. https://sopuli.xyz/c/dach@feddit.de
sopuli.xyz läuft ja auch schon auf der neusten Version. Sind dir da eventuell auch Probleme mit Communities auf anderen Instanzen aufgefallen?
Andere große Instanzen wie lemmy.world, lemmy.ml und sh.itjust.works funktionieren scheinbar. Ich verfolge aber nur communities von feddit.de wirklich aktiv, daher mag das nichts heißen.
Edit: na gut, ein Post von mir von sopuli nach lemmy.world ist nach 24h immernoch nicht förderiert. Das ist aber von sopuli, und nicht nach sopuli…
Diese Info hilft uns schonmal etwas weiter. Vielen Dank!
Ein Post von mir feddit->lemmy.world ist nach >24h noch nicht forderiert.
Eben getestet von lemmy.ml->world ging es sofort.
Lemmy.ml ist auch bereits auf 19.1
Soviel zu meinen Beobachtungen…
Nun gut erstmal frohe Weihnachten euch allen!
Danke. Das bestärkt meine These, dass das ein lokales Problem ist, weil unser eher kleine Server (bzw. die DB) durch das neue Update und die persistente Federationqueue einfach überlastet ist.
Es ist zwar ärgerlich, aber da scheint man im Moment ja nichts dran ändern zu können. Aber vielen Dank, dass ihr als Admin-Team euch nicht nur darum (und die Seite im Allgemeinen) kümmert, sondern dazu auch vernünftig mit uns kommuniziert.
Frohe Feiertage euch allen!
Wenn ich feddit im Browser auf dem iPhone öffne, dann aktualisiert sich die Seite kontinuierlich, was eine ordentliche Benutzung eigentlich unmöglich macht. Hängt das auch mit den aktuellen Problemen zusammen?
Kann ich mir eigentlich nicht vorstellen. Ich kann das auf einem iPhone auch nicht reproduzieren.
Hat die Aktualisierung heute morgen das Problem evtl. behoben?
Nein, leider nicht.
Welche iOS-Version nutzt du? Kommt ansonsten auch keine der Apps in Frage?
17.2.1
Hmm, ich habe leider keine Idee, woran es liegen könnte und kann nur Standardratschläge mitgeben wie Extensions deaktivieren und Cache leeren.
Wenn du keine App nutzen möchtest blieben noch https://phtn.app und https://vger.app als alternative Webapps.
Endlich wieder guter deutscher Content auf meiner Instanz woop woop 🥳
Sind die zwei oben genannten Probleme auch der Grund, warum mich die App, die ich auf meinem Telefon nutze (Voyager) momentan teilweise mehrmals am Tag ausloggt? Passiert total random, einmal mitten während ich einen Kommentar getippt habe, zack, ausgeloggt. Wenn ich mich danach einlogge, ist alles normal. Seit zwei Tagen passierts nicht mehr so häufig aber Anfang der Woche bestimmt drei, vier mal am Tag.
Ja, der zweite Punkt ist die Ursache dafür. Mit dem Update auf Version 1.32.4 sollte das Problem bei Voyager behoben werden, kann allerdings sein, dass der App Store, den du nutzt, die neue Version noch nicht freigeschaltet hat.
Danke dir für die Antwort!
Ps: danke für die Mühen, die du (und die anderen, die Feddit betreiben) Dir machst, um Lemmy für Leute wie mich zugänglich zu machen! Feddit ist mit Abstand die angenehmste Instanz!
Ich freue mich gerade überhaupt diesen Post auf meiner Instanz sehen zu können. Auch wenn nicht alle Kommentare da sind.
Edit: Und nachdem ich meine Instanz neugestartet habe erscheint mein Kommentar auch bei feddit. Der SQL-Befehl, um bei jeder Instanz Updated=Now() zu setzen hat dagegen gar nicht funktioniert. Mal sehen, ob mein Edit es direkt rüber schafft.
Der SQL-Befehl, um bei jeder Instanz Updated=Now() zu setzen hat dagegen gar nicht funktioniert.
Bei uns leider auch nicht :/
Mal sehen, ob mein Edit es direkt rüber schafft.
Hat er \o/ Ich fürchte nur, dass meine Antwort es nicht zurück zu dir schafft.
Aktuell habe ich die Vermutung, dass es als Workaround reicht nur den Lemmy-Server (also nicht die Worker oder UI) einmal neu zu starten. Immer wenn ich das gemacht hatte und ein Auge auf meine Posts und Kommentare geworfen hatte schienen die für immer zeitig föderiert zu werden.
Nur wenn ich alle Docker Container gleichzeitig neu starte fangen irgendwann die Probleme an. Aber sobald ich dann nur
lemmy-server-1
neu starte und nichts mehr anfasse scheint es stabil zu bleiben.Edit: Doch nicht. Es kann sogar sein, dass ältere Kommentare stecken bleiben während neuere föderiert werden. Das heißt ich müsste quasi bei jedem meiner Posts kontrollieren, ob es föderiert.
Schon probiert…
Hmm… seltsamer Effekt: Mein Beitrag ist auf anderen Instanzen vorhanden, aber hier – von wo er ursprünglich stammt – ist er verschwunden: https://lemmy.world/post/10106501
Das kommt daher, dass wir ein Backup von vor etwa 24h einspielen mussten, weil gestern ein schwerer technischer Fehler aufgetreten ist. Für mehr siehe hier.
schwerer technischer Fehler
Postgres korrupt? Gibt hier viele MINTler, kannst gerne ins Detail gehen wenn du magst
Platte ist vollgelaufen 😬 in folge dessen konnte dann das OS (oder zumindest die Dienste) nicht mehr starten.
Die persistent federation queue müllt die DB ganz schön zu, wenn sie nicht geleert wird (was anscheinend durch einen bug bei feddit und anderen Instanzen gerade nicht klappt)
Gäbe wahrscheinlich noch andere recovery Möglichkeiten (nur die entsprechenden columns leeren), aber wintermute ist gerade off Grid unterwegs und hat nicht so viel Zeit (kleiner heads up an der Stelle, Ende Januar kommt ein zweiter Sysadmin dazu)
Verstehe. Ich sah den Pull Request, dass sie die AP Event Publikation via DB queuen wollten. Ich war schon damals sehr skeptisch, denn eine DB ist einfach keine Queue. Bei kleiner Datenmenge geht’s noch aber bei größerer stirbt die DB, sie ist schlicht nicht für einen solchen Anwendungsfall gemacht. Es gibt einen Grund warum RabbitMQ oder Kafka existieren. Wollte mich aber nicht in die Diskussion einschalten, weil der Hauptentwickler in der Vergangenheit auf offensichtliche Verbesserungen sehr… ungewöhnlich reagiert hat, siehe https://github.com/LemmyNet/lemmy/pull/3009
Es gibt einen Grund warum RabbitMQ oder Kafka existieren
Genau mein Gedanke. Keine Ahnung, ob die Devs vielleicht einfach nicht kennen. Das hätte uns die Probleme bestimmt erspart.
Der letzte Kommentar ist gold :D