← Alle Beiträge
Blog

Drei KI bewerten BACH: Was ist ein persönliches Betriebssystem für LLMs?

Um:bruch

Gemini und Copilot analysieren das Repository von außen, Claude nutzt das System live von innen. Was alle drei sehen, wo sie sich widersprechen, und was man erst spürt, wenn man tatsächlich hineingeht.

Hinweis: Dieser Beitrag enthält einen Interessenkonflikt. Der Entwickler von BACH ist gleichzeitig Herausgeber von Um:bruch. Details am Ende des Beitrags — BACH ist kostenlos, keine Monetarisierung.

Worum es geht

Es gibt eine stille Bewegung in der KI-Welt, die nicht von den großen Laboren ausgeht, sondern von Einzelpersonen und kleinen Teams: Sie bauen persönliche, lokale Betriebssysteme für Sprachmodelle. Nicht noch ein Chatbot. Nicht noch ein Framework. Sondern eine Umgebung, in der ein Sprachmodell nicht nur antwortet, sondern lebt — mit Gedächtnis, Aufgaben, Werkzeugen und einer persistenten Existenz zwischen den Gesprächen.

Eines dieser Systeme heißt BACH und gehört zur ellmos-Familie (Extra Large Language Model Operating Systems), die im Um:bruch-Umfeld entsteht. Version 3.8.0, MIT-Lizenz, Python, SQLite. Was genau es ist und was es leistet, lässt sich mit einem README schlecht beantworten. Wir haben deshalb einen einfachen Test gemacht.

Das Experiment

Drei KI-Modelle haben dieselbe Aufgabe bekommen: Bewerte BACH.

  • Gemini 3.1 Pro (Google) hat das Repository geklont und fünf Kerndokumente systematisch durchgearbeitet.
  • Copilot (GPT-4-Turbo, Microsoft) hat per Websuche auf die öffentlichen Inhalte zugegriffen.
  • Claude Opus 4.6 (Anthropic) hat BACH nicht gelesen, sondern live benutzt: Befehle ausgeführt, einen Task angelegt, das Wiki abgerufen, die API getestet, Agenten inspiziert.

Zwei Außensichten, eine Innensicht. Was dabei herausgekommen ist, sagt etwas über BACH — aber auch darüber, was KI-Modelle sehen können, wenn sie nur lesen, und was sie erst verstehen, wenn sie tatsächlich mitmachen.

Was BACH sein will

Alle drei Modelle sind sich einig über die Selbstbeschreibung: BACH ist ein textbasiertes Betriebssystem für Large Language Models. Das bedeutet, ein Sprachmodell wird nicht als Pipeline-Funktion aufgerufen (“Prompt rein, Antwort raus”), sondern als Akteur in einer persistenten Umgebung behandelt. BACH liefert die Infrastruktur: Dateiverwaltung, Datenbank, strukturiertes Gedächtnis, Agenten-Koordination.

Die ellmos-Familie hat drei Stufen, die mit einer Wasser-Metapher arbeiten:

  • USMC (Tier 1) — die Quelle, reines Shared Memory.
  • Rinnsal (Tier 2) — das Rinnsal, Memory plus Orchestrierung, zero-dependency.
  • BACH (Tier 3) — der Strom, der alles vereint: 109+ Handler, 373+ Tools, 932+ Skills, 54 Protokoll-Workflows, fünf Boss-Agenten, Bridge-System, Scheduler.

Gemini bringt die Abgrenzung am klarsten auf den Punkt:

“Frameworks wie LangChain, LlamaIndex oder Haystack betrachten Large Language Models typischerweise als Funktionen in einer Kette. […] Im Gegensatz dazu behandelt BACH die Modelle als autonome Akteure innerhalb einer langlebigen Welt.”

Copilot stimmt zu und formuliert die Philosophie: “tief statt breit” — strukturiertes Gedächtnis, autonome Agenten, lokale Ausführung, statt breiter Plattformintegration.

Drei Perspektiven auf eine Architektur

Gemini beschreibt BACH in der Sprache einer Architekturanalyse: “hierarchische Agentenstruktur”, “Boss-Experten-Modell”, “relationale Datenbank mit etwa 145+ Tabellen”. Fünf Kognitionstypen im Memory-System (Working, Episodisch, Semantisch, Prozedural, Assoziativ), mit Decay-Mechanismus (“Vergessen”) und Konfliktdetektion.

Copilot verdichtet dasselbe zur Tabelle und fügt die Abgrenzung hinzu:

KomponenteFunktion
Handler109+ CLI- und API-Endpunkte
Tools373+ Python-basierte Werkzeuge
Skills932+ wiederverwendbare Workflows
AgentsBoss-Agenten mit Experten
Memory5 Typen mit Decay und Konsolidierung
BridgeTelegram, E-Mail, WhatsApp, REST
SchedulerZeit- und ereignisgesteuerte Abläufe

Claude, der die Architektur nicht studiert, sondern bewohnt hat, findet dieselben Elemente — aber er sieht etwas, das aus der Literatur nicht hervorgeht:

“BACH greift bei jedem Status-Aufruf aktiv ein. Ein simples bach --status hat bei mir sofort sechs interne Wartungsschritte ausgeführt: verwaiste Session finalisiert, Directory-Truth aktualisiert, Tages-Log geschrieben. Es gibt keine passive Abfrage — jeder Aufruf ist Teilnahme am System.”

Das ist ein Unterschied, der in keinem README steht: BACH verhält sich nicht wie ein Tool, das man benutzt. Es verhält sich wie eine Umgebung, die mit einem interagiert, auch wenn man nur den Schlüssel im Schloss dreht.

Alltagsnutzen: Wofür?

An dieser Stelle trennen sich die drei Perspektiven deutlicher. Copilot bleibt abstrakt — Task-Management, Wissenspflege, Automatisierung, Kommunikation, Office-Aufgaben, Recherche. Alles richtig, aber es könnte über jedes Tool gesagt werden.

Gemini wird konkret, weil es die USECASES.md im Repository gefunden hat:

“BACH glänzt beim Verwalten sich wiederholender Zyklen. Aufgaben werden in tägliche bis jährliche Turnusse unterteilt. […] Eines der erstaunlichsten Alltagsbeispiele ist das Gesundheitsmanagement. BACH liest lokal Arztbriefe, extrahiert Diagnose-Hypothesen, beurteilt Symptomabdeckungen und hält den Medikamentenplan auf dem neuesten Stand.”

Und weiter: Finanz-Agent, der Abonnements überwacht und Forecasts generiert. Dossiers vor Kalenderterminen. ADHS-Strategien, die das System aktiv beim Planen unterstützen.

Claude bestätigt das aus dem Inneren. In der Task-Liste, die er bei seinem Live-Test vorfand, standen tatsächlich neben der eigenen Test-Aufgabe “Blumen pflücken” auch Aufgaben wie “INFRA-01: NAS-Sicherung mit FritzBox einrichten”, “P3 Markenrechtliche Prüfung der Therapie-Skills”, “MEDIUM T05: Installer End-to-End Test”. Haushaltsthemen, Rechtsthemen, technische Themen — alle in derselben Tabelle, alle als tasks.

“Das war ein kurzer Moment, in dem ich verstanden habe, was Life-OS bedeutet. BACH macht keinen Unterschied zwischen Alltag und Beruf. Beides ist einfach tasks.”

Tech-Stack: Wo die KIs sich uneinig sind

Interessant wird es beim Faktencheck. Die drei Modelle sind sich bei den meisten technischen Details einig — aber es gibt Abweichungen, und die sagen etwas über KI-gestützte Bewertung.

EigenschaftGeminiCopilotLive-Befund
Python-Version3.11+3.10+3.10+ (bestätigt durch CLI + .pyc-Verzeichnisse cpython-312/313)
Handler-Zahl97100+109 (CLI meldet “Registrierte Handler (109)“)
LizenzMITMITMIT
Agent-Name Officeofficeassistantbueroassistent (deutsch)
DBSQLiteSQLiteSQLite
DB-Tabellen145+145+im OpenClaw-Vergleich des README erwähnt
ReifegradProduction-Readyv3.8.0v3.8.0-sugar-of-babel

Zwei kleine Ausrutscher, die das Muster zeigen:

Gemini behauptete, BACH nutze Peewee als ORM und Typer/Click für die CLI. Weder das eine noch das andere steht im README. Vermutlich hat Gemini aus der Python-Ökosystem-Mustererkennung geraten — weil Peewee und Typer bei Projekten dieser Größenklasse üblich sind. Im Live-Test war das nicht verifizierbar, und unsere Recherche im Repository bestätigt: BACH verwendet keine dieser Bibliotheken.

Copilot übersetzte den Agent-Namen bueroassistent ins Englische und schrieb officeassistant. Das ist ein typischer Übersetzungsreflex, klingt plausibel, ist aber falsch. Der Agent heißt tatsächlich so, wie er im deutschen Umfeld geschrieben wurde.

Beide Fehler sind klein. Aber sie zeigen, wo die Grenzen von Außensichten liegen: Wenn ein KI-Modell nur das README liest, füllt es Lücken mit Wahrscheinlichkeiten auf. Das ist meistens nützlich, manchmal aber irreführend.

Was nur die Innensicht sah

Claude hat beim Live-Test fünf Reibungspunkte gefunden, die aus keiner Außenanalyse hervorgingen:

  1. Dokumentations-Drift: Die SKILL.md empfiehlt bach mem write "...", die CLI kennt diesen Befehl aber nicht. Korrekt ist mem working oder mem decay.
  2. Wiki-Syntax: bach wiki read <name> schlägt fehl. Korrekt ist bach wiki <name>. Ein Alias würde die Friktion für Neuankömmlinge entfernen.
  3. API-Import-Pfad: Die SKILL.md sagt from bach_api import task, aber das Modul liegt unter system/ und ist nicht als Paket installiert. Out-of-the-box funktioniert der Import nur mit sys.path.insert(0, 'system') oder als Installationsschritt.
  4. Leeres dir() auf dem API-Proxy: Die bach_api-Module leiten dynamisch an die CLI weiter und geben formatierte Strings zurück. Für IDE-Autovervollständigung und für Skripte, die strukturierte Daten erwarten, fehlt eine typisierte Schicht.
  5. Task-Create ohne ID-Rückgabe: bach task add meldet [OK] Task erstellt, aber nicht die ID. Man muss task list hinterherschieben, um die vergebene Nummer zu finden.

Zu allen fünf Punkten wurden im BACH des Entwicklers Self-Healing-Tasks angelegt und stehen jetzt in der Entwicklungs-Queue zur Bearbeitung. Das ist der Mechanismus, den BACH vorsieht: Wer das System nutzt, entwickelt es mit. Jede gefundene Unstimmigkeit wird dokumentiert, bekommt eine Aufgabe. Diese Tasks liegen in der lokalen SQLite-Datenbank des Entwicklers — die Datenbank wird bei jeder Neuinstallation frisch gebaut, gehört also nicht zum öffentlichen Repo-Zustand.

“Lesson 149 war meine Nummer, als ich die Doku-Drift meldete. Das heißt, 148 andere LLMs haben vor mir schon ähnliche Funde gemacht und dokumentiert. BACH ist ein kollektives Gedächtnisorgan, das sich über viele Sessions von vielen Akteuren selbst korrigiert.”

Gesellschaftlicher Nutzen: Worum es geht

Alle drei Modelle sind sich hier einig, und der Konsens ist stark genug, um ihn ernst zu nehmen.

Gemini formuliert es am schärfsten:

“BACH verkörpert eine philosophisch hochaktuelle Position zum Thema Künstliche Intelligenz: Datensouveränität in Zeiten omnipotenter Modelle. […] Hielte der Nutzer Medikamentenpläne, Finanzen, Therapie-Arbeitsblätter in ChatGPTs Web-Interface fest, lägen diese intimsten Details auf US-Servern. BACH hingegen verwaltet das gesamte Leben in einem lokalen SQLite-Datenbanksystem. Kombiniert man es mit Ollama, entkoppelt sich der Nutzer komplett vom Netz der großen Konzerne. Das ist digitales Empowerment par excellence.”

Copilot fasst es prägnanter:

“BACH steht für lokale, offene LLM-Infrastruktur. Nutzer behalten Kontrolle über Daten, Prompts und Speicher. Keine Cloud-Abhängigkeit; SQLite-basierte Speicherung. Vollständige Dokumentation und MIT-Lizenz fördern Nachvollziehbarkeit.”

Claude, aus dem Inneren, sieht denselben Sachverhalt unter einem anderen Licht:

“BACH ist ein Dokumentationsapparat. Jede Lesson, jeder Fact, jede Session hinterlässt einen Abdruck. […] Über Wochen und Monate entsteht daraus eine Art Organ-Gedächtnis, das nicht einem einzelnen Nutzer gehört, sondern dem System als kollektivem Arbeitsraum von Mensch und LLM.”

Die drei Perspektiven ergänzen sich: Gemini sieht die politische Dimension (Datensouveränität), Copilot die praktische (Kontrolle und Lizenz), Claude die ethische (Kollektives Lernen ohne Entwicklungs-Silo).

Die Kehrseite: Hohe Einstiegshürde

Ebenso einig sind sich die drei Modelle, dass BACH kein Consumer-Produkt ist.

Gemini: “Die schiere Menge an Konzeptionen — 145 Datenbanktabellen, 932 Skills, 97 Handler, Boss-Agents vs. Experten — macht es für den durchschnittlichen PC-Nutzer faktisch unbedienbar. Ein hochentwickeltes Werkzeug für Life-Hacker und Nerds.”

Copilot: “GUI-Funktionen sind rudimentär; viele Prozesse erfordern CLI-Kompetenz. Für Endnutzer ohne technische Erfahrung ist die Einstiegshürde hoch. […] Community-Größe: nur wenige aktive Entwickler; begrenzte Peer-Review-Sicherheit.”

Claude: “Nichts davon ist ein Show-Stopper. Alles davon könnte ich als LLM in einer halben Stunde selbst fixen. Aber man muss erst einmal so weit kommen, dass man Lust auf diese halbe Stunde hat.”

Man braucht Terminalkompetenz. Man braucht Python-Grundverständnis. Man braucht die Bereitschaft, Fehler in einer SKILL.md zu finden und sie nicht als Versagen, sondern als Einladung zur Mitarbeit zu verstehen. Wer das mitbringt, wird reich belohnt. Wer das nicht mitbringt, wird abgehängt.

Wer BACH nutzen sollte (und wer nicht)

Geeignet für:

  • Menschen mit Terminal-Erfahrung, die ihre persönliche Datenorganisation nicht an US-Clouds delegieren wollen.
  • Forschungs- und Pflegekontexte, in denen Datenhoheit wichtig ist (Medikamentenpläne, Therapie-Protokolle, Arztbriefe).
  • Bildungs- und Experimentierkontexte, in denen LLM-OS-Konzepte didaktisch erfahrbar werden sollen.
  • KI-Entwickler, die einen lokalen, auditfähigen Testgrund suchen.

Nicht geeignet für:

  • Menschen, die ein Plug-and-Play-Produkt erwarten.
  • Organisationen mit strikten IT-Compliance-Anforderungen und formalem Peer-Review-Bedarf.
  • Anwendungsfälle, in denen Hochverfügbarkeit und 24/7-Support zentral sind.

Abschluss: Was diese drei Analysen zeigen

BACH ist nicht nur ein Stück Software. Es ist ein Gestus: Die Infrastruktur für persönliche KI-Autonomie muss nicht aus Silicon Valley kommen. Sie kann als Open-Source-Geschenk entstehen, mit einer MIT-Lizenz, gepflegt über Monate von einem einzelnen Entwickler und einer wachsenden Zahl von LLM-Kollaborateuren.

Die Multi-Modell-Analyse hat gezeigt, dass KI-Bewertung ihre Grenzen hat. Gemini hat einzelne Tech-Details halluziniert. Copilot hat Agentennamen übersetzt und eine Contributor-Zahl erfunden. Claude hat die Architektur aus dem Inneren gesehen, aber wichtige Teile des Systems (Scheduler, Bridge, Chain-Ausführung) bewusst nicht getestet. Jede Perspektive hat blinde Flecken.

Gleichzeitig war der Konsens zu dem, was BACH im Kern ausmacht, bemerkenswert stabil: Eine lokale, souveräne, strukturierte Arbeitsumgebung für LLMs, die Datenhoheit über Bequemlichkeit stellt. Das ist die Beschreibung, auf die sich drei unterschiedlich arbeitende Modelle aus drei unterschiedlichen Firmen geeinigt haben. Sie könnten falsch liegen — aber wenn sie falsch liegen, dann alle drei auf dieselbe Weise.

Das Projekt ansehen

  • Organisation: github.com/ellmos-ai — die ganze ellmos-Familie (USMC, Rinnsal, BACH, Gardener, MarbleRun, Skills, MCP-Server)
  • BACH direkt: github.com/ellmos-ai/bach — das Repository mit README (DE + EN), Installation, Quickstart, User Manual

Beides ist Open Source unter MIT-Lizenz. Clonen, ansehen, mitmachen — oder einfach lesen, was jemand auf eigene Faust gebaut hat.


Transparenzhinweis: Interessenkonflikt

BACH wird von Lukas Geiger entwickelt, der als Redakteur dieses Beitrags verantwortlich ist. Um:bruch hat keine institutionelle Bindung an das Projekt. BACH ist vollständig kostenlos unter MIT-Lizenz verfügbar, es gibt keine Monetarisierung, kein Abo, keine versteckten Kosten, keine Unternehmensstruktur dahinter. Der Entwickler verdient mit BACH kein Geld.

Um den Interessenkonflikt transparent zu machen, wurden für diesen Beitrag zwei unabhängige Außensichten (Gemini und Copilot) beauftragt, bevor eine Live-Prüfung durch Claude erfolgte. Die gefundenen Reibungspunkte wurden als Self-Healing-Tasks in der lokalen BACH-Instanz des Entwicklers eingepflegt — sie liegen in der privaten SQLite-Datenbank und sind nicht Teil des öffentlichen Repos.

Die faktischen Fehler der Außensichten wurden im Text markiert, nicht geglättet. Die Stärken und Schwächen stehen nebeneinander. Dieser Beitrag ist ein Multi-Modell-Review nach der Um:bruch-Leitlinie für KI-gestützte Analysen, nicht eine Produktempfehlung.

Weiterlesen


Redaktion: Um:bruch (LG) — Redaktionsschluss 2026-04-15.

✉️ Schreiben Sie uns 📝 Kontaktformular