Runs local. Stays local.

KI-Assistenz, die in Ihrer Kanzlei bleibt.

Lokale KI für Arztpraxen, Anwalts- und Steuerkanzleien. Bearbeitet Korrespondenz, Akten und Wiedervorlagen eigenständig — und Mandanten- wie Patientendaten verlassen dabei Ihre Systeme nicht. § 203 StGB konform by design.

Erledigt Vorgänge — nicht nur Fragen
Auf Ihrer Hardware, nicht in der Cloud
§ 203 StGB · § 62a StBerG · § 43e BRAO

Die Ausgangslage

Drei Dinge, die zusammen immer schlimmer werden.

Der Schreibtisch wird voller. Korrespondenz, Wiedervorlagen, Belege, Termin­vorbereitung — die Mandantenzeit frisst das alles weg. Die Arbeit ist nicht schwieriger geworden, nur mehr. Und an genau den Stellen, an denen Sie eigentlich für Ihre Mandanten oder Patienten da sein sollten, sitzen Sie am Schreibtisch und sortieren.

Die offene Stelle bleibt offen. Assistenz, Sekretariat, MFA, Steuerfach­angestellte — ausgeschrieben seit Monaten, qualifizierte Bewerbungen kaum. Die Arbeit, die keiner übernimmt, bleibt beim Inhaber hängen. Der Engpass ist demografisch und damit strukturell — er verschwindet nicht.

Und ChatGPT darf nicht mitlesen. § 203 StGB verbietet es faktisch. Mandanten- und Patientendaten in eine US-amerikanische KI-Cloud zu geben ist keine Datenschutz-Frage, sondern ein Straftatbestand — unabhängig davon, wie DSGVO-konform der Anbieter wirbt. Auch deutsche Cloud-KI ist juristisch keine Lösung, solange Sie nicht für jeden einzelnen Mandanten eine nachweisbare Einwilligung vorliegen haben. In der Praxis scheitert genau daran jedes klassische KI-Tool.

Die Antwort

Ein KI-Assistent, der bei Ihnen wohnt.

Arbeitet eigenständig.

Der Assistent bearbeitet Vorgänge von Anfang bis Ende: Mails entwerfen, Akten zusammenfassen, Termine vorbereiten, Rechnungen vorprüfen. Er fragt Sie nur dort, wo Sie entscheiden müssen.

01

Bleibt in Ihrem Haus.

Alles läuft auf Hardware in Ihrem Büro. Kein Datenabfluss, keine Cloud-Abhängigkeit, kein laufendes Abo pro Kopf. Einmal eingerichtet, können Sie den Stecker zum Internet ziehen — der Assistent arbeitet weiter.

02

Lernt aus Ihren Unterlagen.

Wir richten den Assistenten auf Ihren Aktenbestand, Ihre Vorlagen und Ihre Formulierungen aus. Er antwortet im Ton Ihrer Kanzlei, nicht im Ton eines Silicon-Valley-Chatbots.

03

Keine Cloud. Keine US-Server. Kein Datenabfluss. Runs local. Stays local.

Leistungen

Vier Wege, wie wir Sie unterstützen.

Von der strategischen Analyse bis zum laufenden Betrieb Ihres KI-Assistenten — alles aus einer Hand, alles auf Ihre Berufsordnung abgestimmt.

01

Lokaler KI-Assistent

Ein lokaler KI-Assistent für Ihre Kanzlei oder Praxis — von der Hardware-Auswahl über das passende Sprachmodell bis zur Inbetriebnahme und Mitarbeiterschulung.

  • Hardware-Beratung (Apple Silicon bis NVIDIA-GPU)
  • Modell-Auswahl nach Sprache und Anwendungsfall
  • Integration in Ihre bestehende IT
  • Dokumentation und Übergabe
02

Assistenz für Akten, Korrespondenz und Wiedervorlagen

Ihr Assistent fasst Schriftsätze zusammen, findet Passagen quer über Ihren Aktenbestand und entwirft Schreiben in Ihrem Ton — alles lokal, ohne Cloud-Weiterleitung.

  • Zusammenfassung langer Mandantenschriftsätze
  • Suche quer über Ihren gesamten Aktenbestand
  • Entwurfsgenerierung aus Ihren Vorlagen
  • Audit-Log jeder Anfrage
03

KI-Audit & Strategie

Prozessanalyse, Potenzialidentifikation und rechtlicher Machbarkeits-Check, bevor Sie investieren.

  • Zwei Wochen strukturierte Analyse
  • Use-Case-Priorisierung
  • Rechts- und Compliance-Check (§ 203, DSGVO)
  • Umsetzungsempfehlung mit Kostenschätzung
04

Digitale Präsenz

Homepages, die zu Ihrer Berufsordnung passen — DSGVO-sauber, ohne Tracking-Fallen, ohne US-Abhängigkeiten.

  • Kein Google, kein Meta-Pixel, keine US-Tracker
  • Cookie-freie Analytics (EU-Server)
  • Barrierefrei nach BFSG
  • Wartungsarm auf Astro/Cloudflare-Basis

Mechanik

Keine Magie. Keine Cloud. Keine Black Box.

So einfach ist die Idee dahinter: drei Ebenen, alle unter Ihrer Kontrolle — zusammen ergeben sie einen KI-Assistenten, der Ihr Haus nicht verlässt.

  1. 01

    Hardware bei Ihnen

    Ein kompaktes lokales Gerät — Apple Silicon oder NVIDIA-GPU, passend zu Ihrer Kanzlei- oder Praxisgröße. Das Gerät steht in Ihrem Serverraum oder Büro. Aufstellung, Einrichtung und Absicherung übernehmen wir.

  2. 02

    Offene Modelle, lokal betrieben

    Wir installieren offene Sprachmodelle (Llama, Qwen, Mistral) auf Ihrer Hardware. Keine API-Calls, keine externe Inferenz. Die Modelle haben dokumentierte Gewichte und lassen sich unabhängig auditieren — und tragen den Assistenten, mit dem Ihr Team täglich arbeitet.

  3. 03

    Ihre Daten bleiben bei Ihnen

    Ihre Dokumente werden lokal indiziert und verarbeitet. Kein Upload zu Dritten. Kein Training der Modelle auf Ihren Daten. Keine Telemetrie. Wenn Sie das Gerät ausschalten, ist der Assistent offline.

Welche Hardware Sie brauchen, hängt von Ihrer Kanzlei- oder Praxisgröße, Ihren Use-Cases und dem gewünschten Antwortverhalten ab. Die Entscheidung treffen wir gemeinsam im Erstgespräch.

Investition

Transparente Preise, projektbasiert.

Wir arbeiten projektbasiert statt mit monatlichen Retainer-Modellen. Sie zahlen für ein klar definiertes Ergebnis — nicht für ungenutzte Kapazitäten.

KI-Audit

3.900 €

Zweiwöchige strukturierte Prozessanalyse mit rechtlicher Einordnung und konkreter Umsetzungsempfehlung.

  • Bestandsaufnahme Ihrer Prozesse
  • Identifikation der drei größten Hebel
  • Rechts- und Compliance-Check (§ 203, DSGVO)
  • Schriftliche Roadmap mit Kostenschätzung
Erstgespräch buchen

Assistent Professional

45.000 – 75.000 €

Kanzleiweiter KI-Assistent für mehrere Abteilungen und Use-Cases — mit Hochverfügbarkeit und Backup.

  • Leistungsstarke Hardware
  • Mehrere Modelle für unterschiedliche Aufgaben
  • Vier bis sechs Anwendungen integriert
  • Ausfallsicherheit und Backup-Konzept
Erstgespräch buchen

Laufender Betrieb (optional): 850 – 3.500 € pro Monat in drei Stufen (Basis / Business / Premium) — Reaktionszeiten 8 h / 4 h / 1 h, Modell-Aktualisierungen alle 3–6 Monate, quartalsweise Kanzlei-Sprechstunde. Ergänzungen jenseits der Pakete rechnen wir transparent ab: Beratung 180 €/h, Entwicklung 140 €/h.

Alle Preise zzgl. gesetzlicher Umsatzsteuer.

Über den Gründer

Dr.-Ing. Sven Rost

Dr.-Ing. Sven Rost

Mein Name ist Dr.-Ing. Sven Rost. Ich habe einen Abschluss in Mechatronik und eine Promotion in Robotik an zwei der führenden technischen Universitäten Deutschlands — fundiert in Regelungstechnik, Systemidentifikation und Automatisierung.

In den letzten 15+ Jahren habe ich internationale Führungspositionen in vier Ländern bekleidet — als Institutsdirektor, Vize-Rektor und Strategieberater. Ich habe Kooperationsnetzwerke aufgebaut, Drittmittel im siebenstelligen Bereich eingeworben und auf Regierungsebene beraten. Aktuell verantworte ich zudem strategische Partnerschaften und Geschäftsentwicklung in einem Technologieunternehmen.

Gegründet habe ich das Unternehmen, weil genau die Berufsgruppen, die am dringendsten Entlastung durch KI bräuchten — Steuerberater, Anwälte, Ärzte — die Technologie rechtlich am wenigsten einsetzen dürfen. Die Lösung liegt nicht in einem weiteren Cloud-Dienst mit Werbeversprechen, sondern in souveräner Infrastruktur, die auf Ihrer Hardware, unter Ihrer Kontrolle und nach Ihren Regeln läuft.

Philosophie

KI soll Ihre Mitarbeiter entlasten — nicht ersetzen. Jeder Assistent wird gemeinsam mit Ihrem Team entwickelt und auf Ihre konkreten Arbeitsabläufe abgestimmt.

  • Dipl.-Ing. Mechatronik Technische Universität Dresden
  • Dr.-Ing. Robotik Technische Universität Braunschweig
  • Director Strategic Initiatives E-Quadrat Science + Education
  • Gründer merlon.ai

Fragen & Antworten

Häufig gestellte Fragen

Für welche Berufsgruppen eignet sich Ihre Lösung?

Unser Fokus liegt auf Berufsgeheimnisträgern nach § 203 StGB — namentlich Steuerberater (§ 62a StBerG), Rechtsanwälte (§ 43e BRAO) und Ärzte. Dort ist der Einsatz klassischer Cloud-KI rechtlich problematisch bis ausgeschlossen.

Auch andere Branchen mit strengen Vertraulichkeitsanforderungen profitieren von on-premise KI: Wirtschaftsprüfer, Notariate, Patentanwälte, Psychotherapeuten, mittelständische Forschungsabteilungen und Unternehmen mit hohem IP-Schutzbedarf. Sprechen Sie uns an — wir prüfen im Erstgespräch, ob unser Ansatz zu Ihrer Situation passt.

Welche Hardware brauche ich konkret?

Das hängt von drei Faktoren ab: der Anzahl gleichzeitiger Nutzer, der Art der Dokumente (PDF-Schriftsätze vs. Scan-Akten) und der gewünschten Antwortgeschwindigkeit.

Grobe Orientierung:

  • Einzelkanzlei oder kleine Praxis (1–3 Nutzer): Ein Mac Studio M-Series oder ein leistungsfähiger Mini-PC (ab ca. 3.500 €). Trägt einen Assistenten für Akten-Zusammenfassungen, Volltextsuche und Entwurfsgenerierung.
  • Mittlere Kanzlei (5–15 Nutzer): Eine NVIDIA-DGX-Workstation oder dedizierter GPU-Server (ca. 8.000–15.000 €). Mehrere Modelle parallel für mehrere Assistenten-Rollen, höhere Antwortqualität, zuverlässige Antwortzeiten.
  • Größere Kanzlei oder hohe Anforderungen: Rack-Server mit mehreren GPUs (ab 20.000 €). Hochverfügbarkeit, Backup, skaliert mit dem Team.

Die exakte Konfiguration legen wir nach der Use-Case-Analyse fest. Wir vermitteln die Hardware nicht — Sie kaufen direkt beim Hersteller oder Händler Ihrer Wahl.

Wie schnell ist das umgesetzt?

Ein typischer Projektablauf dauert acht bis zwölf Wochen ab Auftragsfreigabe:

  1. Woche 1–2: Use-Case-Feinplanung und Hardware-Spezifikation
  2. Woche 3–4: Hardware-Beschaffung (durch Sie) und Grundinstallation vor Ort
  3. Woche 5–7: Modell-Auswahl, Feintuning auf Ihren Dokumenten, Integration in Ihre Arbeitsumgebung
  4. Woche 8: Schulung, Abnahme und Übergabe der Dokumentation
  5. Woche 9–12 (optional): Begleiteter Einführungsbetrieb mit wöchentlichen Sprechstunden

Für das KI-Audit als alleiniges Vorschaltprojekt rechnen Sie mit zwei Wochen Bearbeitungszeit ab Kickoff.

Sind meine Mandantendaten wirklich sicher?

Ja — und das ist kein Marketing-Versprechen, sondern eine Eigenschaft des Systemaufbaus.

Der Assistent läuft auf Hardware in Ihren Räumen. Es gibt keine API-Calls zu externen Anbietern, keine Trainingsdaten-Übermittlung, keine Telemetrie. Sie können das Gerät physisch vom Internet trennen, und der Assistent funktioniert weiter.

Zur Absicherung kommen übliche On-Premise-Praktiken hinzu: verschlüsselte Datenträger, SSH-Hardening, detaillierte Audit-Logs jeder Anfrage, rollenbasierte Zugriffsrechte. Bei Bedarf erstellen wir eine Datenschutz-Folgenabschätzung (DSFA nach Art. 35 DSGVO) und einen Auftragsverarbeitungsvertrag mit § 203-Zusatz.

Der Unterschied zu Cloud-KI ist strukturell: Bei einem US-Anbieter müssen Sie Einwilligungen einholen und dem Anbieter vertrauen. Bei einer On-Premise-Lösung verlassen Ihre Daten Ihre Infrastruktur gar nicht erst — die Einwilligungsfrage stellt sich nicht.

Was passiert nach dem Erstgespräch?

Das Erstgespräch dauert 45 Minuten, ist kostenlos und unverbindlich. Wir lernen Ihre Abläufe kennen und identifizieren gemeinsam, wo KI einen messbaren Unterschied machen würde.

Innerhalb von fünf Werktagen erhalten Sie von uns eine schriftliche Einschätzung mit:

  • konkreter Empfehlung, ob und wie ein lokaler KI-Assistent zu Ihrer Situation passt,
  • Vorschlag für ein Einstiegs­projekt (KI-Audit oder direkt Assistent Starter),
  • transparente Preise ohne versteckte Nebenkosten,
  • offene Fragen und Unsicherheiten, die vor einer Entscheidung zu klären sind.

Wenn Sie nach dieser Einschätzung fortsetzen möchten, unterschreiben wir ein Angebot und beginnen. Wenn nicht, haben Sie in jedem Fall eine belastbare Einordnung — nutzen Sie sie gern für andere Anbieter-Gespräche.

Und wenn das Projekt nicht den gewünschten Mehrwert bringt?

Wir arbeiten mit einem zweistufigen Absicherungsmodell statt mit einer pauschalen Geld-zurück-Garantie — weil letztere bei Hardware-Projekten nicht redlich wäre.

Erstens: Proof-of-Concept vor Vollinvestition. Wenn Sie sich nicht sicher sind, starten Sie mit dem KI-Audit (3.900 €) oder einem zweiwöchigen Proof-of-Concept auf ausgeliehener Hardware. Erst danach entscheiden Sie über das Gesamtprojekt.

Zweitens: Fixpreis statt Stundenabrechnung. Unsere Projektpreise sind Fixpreise. Wenn wir den Aufwand falsch geschätzt haben, tragen wir das Risiko — nicht Sie.

Hardware, die Sie bereits gekauft haben, bleibt in Ihrem Eigentum und behält ihren Wert auch außerhalb unseres Setups. Das Modell ist Open Source, der Code ist dokumentiert, die Dokumentation liegt bei Ihnen. Sie sind weder technisch noch vertraglich an uns gebunden.

Welche Technologien setzen Sie ein?

Wir setzen konsequent auf Open-Source-Komponenten und dokumentierte Schnittstellen — keine proprietären SaaS-Abhängigkeiten im produktiven Pfad.

Modelle & Inferenz. Große Sprachmodelle aus der offenen Ökosystem-Linie (u. a. Llama, Mistral, Qwen), lokal betrieben über Laufzeiten wie Ollama oder vLLM. Auswahl und Quantisierung richten sich nach Ihrer Hardware — Apple Silicon (M-Serie) für kompakte Kanzlei-Setups, NVIDIA-GPUs für größere Kontextfenster und parallele Assistenten-Rollen.

Betrieb & Zugriff. Cloudflare Tunnel für den externen Zugriff, damit keine offenen Ports am Kanzleinetz exponiert werden. Authentifizierung per TOTP-basiertem 2FA, Passwörter mit bcrypt gehasht, rollenbasierte Rechte, vollständige Audit-Logs jeder Anfrage. Tägliches verschlüsseltes Backup, Wiederherstellung regelmäßig getestet.

Portabilität. Der gesamte Stack läuft containerisiert (Docker) und ist auf Standard-Linux-Hardware lauffähig. Code, Konfiguration und Dokumentation liegen bei Ihnen — weder Modelle noch Infrastruktur sind an einen proprietären Anbieter gebunden. Wenn Sie die Zusammenarbeit mit uns beenden, bleibt das System vollständig funktionsfähig und kann von jedem Dienstleister mit Linux-Kompetenz übernommen werden.

Konkrete Versionen, Quantisierungsstufen und Hardware-Dimensionierung legen wir in der Audit-Phase anhand Ihrer realen Arbeitslast fest — nicht vorab nach Katalog.

Erstgespräch

45 Minuten. Kostenlos. Unverbindlich.

Wir lernen Ihre Abläufe kennen, identifizieren gemeinsam mögliche Hebel und liefern innerhalb von fünf Werktagen eine schriftliche Einschätzung — mit konkreter Empfehlung und transparenter Preisangabe.

Termin direkt buchen

Wählen Sie einen freien 45-Minuten-Slot. Wir telefonieren oder treffen uns per Videokonferenz — Ihre Wahl, wir rufen Sie zurück.

Terminbuchung läuft über unsere eigene, self-hosted Infrastruktur in Deutschland — kein externer Anbieter.

Kurz per Messenger

Für eine schnelle Rückfrage oder Terminabstimmung — keine App-Installation nötig, beide Links öffnen direkt den jeweiligen Chat.

Hinweis: Messenger eignen sich für Terminabsprache und allgemeine Fragen — nicht für mandanten- oder patientenbezogene Inhalte. Für vertrauliche Informationen nutzen Sie bitte das Erstgespräch oder eine verschlüsselte E-Mail.

Schreiben Sie uns

Schildern Sie uns Ihre Situation in zwei, drei Sätzen — wir melden uns innerhalb eines Werktags persönlich zurück. Oder direkt per E-Mail an contact@merlon.ai.

Keine Weitergabe an Dritte. Keine Tracker. Ihre Nachricht wird verschlüsselt übertragen und nur intern verarbeitet.