AnsweredAssumed Answered

AWA 12.1.2: ENDED_VANISHED von Unix-Jobs

Question asked by ManfredMauermann on Oct 8, 2018
Latest reply on Nov 7, 2018 by ManfredMauermann

Hallo zusammen,

 

jetzt muss ich doch noch mal die Frage in die Runde stellen, ob nur wir von diesem Fehler betroffen sind. Wir hatten das ja mal im Kontext Unix-Shell mit "exit $rc". Das haben wir aber mit der Klammerung "(exit $rc)" soweit gelöst.

Dieser neue Effekt kommt ca. 6 Wochen nach Livegang mit der 12.1.2. Tritt sporadisch über den ganzen Tag verteilt auf. Der Verdacht liegt nahe, dass die Ursache lastabhängig ist. Ca. 1300 Events, von denen halt der Großteil öfters gemeinsam feuern. Andere Mandanten bleiben von diesem Fehler weitgehend verschont.

 

Incident ist natürlich eröffnet, das zieht sich aber mit der Trace-Erstellung und Lieferung der angeforderten Logdateien insgesamt leicht.... Sind oftmals viele GB, die hier hochgeladen werden müssen und vorher wird da leider niemand aktiv.

 

Einmal gab es einen kleinen Hoffnungsschimmer, weil wir von unserem Provider eine Liste mit wegen Out of Memory abgebrochenen Prozessen bekamen und wir daraufhin von 12 auf 32GB Hauptspeicher erhöht haben. Das wars aber leider nicht, die OOMs waren weg, die ENDED_VANISHED aber immer noch da. Auch spannend, sechs Wochen lang keine Probleme und plötzlich geht es los.

 

Ein anderes Mal war unsere Netapp etwas stärker frequentiert, und wir konnten Job-Aktivierungszeiten von 5 Minuten beobachten, aber auch das wurde behoben und liegt wieder im normalen Bereich. Die Reaktionszeiten vom AWI mal außen vor gelassen. Ich verstehe die Kollegen, welche für zeitkritische Arbeiten noch auf die Java-UI zurückgreifen.

 

Trotz der ganzen Hektik, sonnige Grüße aus Nürnberg

Manfred

Outcomes