Es ist 23:47 Uhr. Mein Monitoring meldet: Server down.

Also wieder das gewohnte Ritual: Browser auf, Login beim Hoster, durch drei Menüebenen klicken, Server auswählen, “Neustart” finden, bestätigen, warten. Großartig..
Auch nervig, wenns beim entwickeln passiert, ab und zu stürzt der Server ja doch ab. Und der Login gilt immer nur für 5 Minuten. Gestern war klar: Das geht so nicht weiter.
Also kurze Web Recherche und CLI-Anything von HKUDS gefunden. Ein Framework, das genau die Lücke schließt, die ich gesucht hatte: Es macht beliebige Software über die Kommandozeile bedien- und somit automatisierbar..
Die Idee dahinter ist simpel und gleichzeitig elegant: KI-Agenten sind gut im Denken, aber schlecht im Klicken. UI-Automation ist fragil, APIs sind oft unvollständig. CLI hingegen ist strukturiert, deterministisch und meistens völlig frei von Fragezeichen 😉 Genau die Sprache, die Agenten verstehen.
Ich habe also einen kleinen Versuch gestartet und ein CLI für meinen Hoster gebaut. Die KI hat die relevanten Endpoints aus der Web-Oberfläche extrahiert, Command-Gruppen entworfen, Click-CLI implementiert. Am Anfang gab es etwas Reiberei mit dem CSRF-Token bei der Authentifizierung aber das ist genau der Punkt, an dem der Mensch noch zählt 😂 Wer schon mal Session-Handling debuggt hat, weiß, wo man hinschauen muss. Ein Agent allein hätte da vermutlich noch eine Weile im Kreis gedreht.
Credentials liegen sauber in einer .env, das Tool kümmert sich um Login, Session und API-Calls. Das Ergebnis:
"hoster restart --server prod-01"
Ein Befehl statt drei Minuten rumgeklicke. Mein Monitoring kann das jetzt selbst auslösen. n8n bindet es als Subprozess ein. Bash-Skripte nutzen es auch. Und das beste daran: mein Monitoring braucht keinen Zugriff mehr auf meinen Wecker.
Aber das war ja "nur" ein Hoster-Dashboard. Und das Prinzip funktioniert für praktisch jeden Webservice.
Was mir besonders gefällt: Es befreit mich von dem Teil, der eher weniger Spaß macht. Strukturen erkennen, Auth verstehen, Edge Cases abdecken, dafür braucht es immer noch jemanden, der weiß, was er tut. Aber Endpoints abklappern und Argparser tippen? Das darf gerne die Maschine machen.
Was sind denn eure Webservices, die ihr am liebsten in eine CLI verwandeln würdet? Welches Tool nervt euch beim manuellen Bedienen am meisten? Schreibt es gerne in die Kommentare, ich bin neugierig, was bei euch auf der Liste steht!