Lokal gehostete Open-Source-KI-Agentensysteme
Vom Hype zur produktiven Geschäftsanwendung
BLOCK 01EINSTIEG
Meine Reise mit KI
1
Dezember 2022: Schon in der ersten Woche nach dem ChatGPT-Release damit die Rede für unsere Weihnachtsfeier geschrieben.
2
März 2023: Eine Woche nach dem ChatGPT-API-Release in unser Ticketsystem integriert – die erste produktive KI-Funktion.
3
Seither: Eigene Vorträge zur tatsächlichen Funktionsweise neuronaler Netze und zum Thema KI & Ethik.
4
März 2026: An fast jedem Arbeitstag eine komplette KI-Anwendung gebaut – nur via Spracheingabe, mit dem Ziel: an 5 Tagen in Folge einen One-Shot zu bekommen (beim ersten Aufruf exakt wie gewünscht und fehlerfrei).
Vom ersten ChatGPT-Tag bis heute – immer im praktischen Einsatz.
BLOCK 01EINSTIEG
Vor drei Monaten …
- Vor drei Monaten habe ich diesen Vortrag angemeldet – Arbeitstitel: „N8N + lokales LLM, Workflows bauen“.
- Das klang damals schon nach Zukunft.
- Drei Monate später ist die Welt eine andere.
- Heute zeige ich nicht den damals geplanten Workflow, sondern das, was heute möglich ist.
- Ich baue nicht mehr mit fremden Open-Source-Tools Workflows – ich baue für jede Anforderung das für mich perfekte (Open-Source-) Tool selbst.
Und zwar an einem echten Fall aus unserem eigenen Haus.
02
BLOCK 02
Firmenvorstellung
BLOCK 02FIRMENVORSTELLUNG
Wer ist die K&K Software AG?
IT-Dienstleister aus Gerolzhofen, Unterfranken – eigenes Haus mit 800 m².
Gegründet 2000, Wurzeln bis 1995 – über 25 Jahre Prozessdigitalisierung.
30 Mitarbeitende.
Drei Teams: Open-Source-ERP (ERPNext), Individuelle Softwareentwicklung (.NET/C#/Blazor/MS-Access), Business IT & Systemhaus.

Unser Team – Gerolzhofen, Frühjahr 2026
BLOCK 02FIRMENVORSTELLUNG
Unsere DNA: Open Source & digitale Souveränität
25+ Jahre Open Source
Konsequent Open Source – aus Überzeugung, nicht als Trend. Genau deshalb sprechen wir heute über lokale, offene KI.
Kontrolle
Hoheit über Quellcode und Daten. Keine Lizenzkosten, kein Vendor-Lock-in.
Unabhängigkeit
Unabhängig von einzelnen Anbietern – und vom Ausland. Digitale Souveränität als Haltung.
BLOCK 02FIRMENVORSTELLUNG
Warum gerade wir über dieses Thema sprechen
Wir entwickeln selbst
.NET / C# / Blazor – seit Jahren unser Stack. Der Showcase heute läuft auf genau diesem Stack.
Access ist Tagesgeschäft
Access-Modernisierung gehört zum Alltag: alte Access-DBs werden zu modernen Webanwendungen.
KI ist im Einsatz
KI-Integration machen wir bereits – für Kunden und intern im eigenen Haus.
03
BLOCK 03
Was euch erwartet
BLOCK 03ÜBERBLICK
Der rote Faden des Vortrags
1
Wo wir vor drei Monaten standen – und wo wir heute stehen
2
Der Open-Source-Stack für lokale KI-Agenten
3
Der Pain Point: Microsoft-Access-Altlasten
4
Showcase: Access-DB zu moderner Webanwendung – mit Live-Demo
5
Architektur & unsere eigene Ollama-Installation
6
Was ihr daraus mitnehmen könnt
04
BLOCK 04
Die KI-Landschaft 2026
BLOCK 04LANDSCHAFT 2026
Damals – Heute – Morgen
| Damals (Feb 2026) | Heute (Mai 2026) | Morgen |
|---|
| Lokale Modelle: brauchbar, klein | Lokale Modelle: produktionsreif, mittelgroß | Lokale Modelle: spezialisiert je Domäne |
| Workflows werden orchestriert | Agenten mit Tool-Use | Agenten-Teams |
| Mensch betreibt Prompt-Engineering | KI generiert eigene Spezifikationen | KI baut sich selbst |
BLOCK 04LANDSCHAFT 2026
Lokale KI ist produktionsreif
41 %
KI-Adoption im deutschen Mittelstand 2026 – mehr als verdoppelt gegenüber 17 % in 2024 (Bitkom 2026)
91 %
der deutschen Unternehmen halten generative KI für strategisch wichtig – im Vorjahr waren es 55 %
Lokale KI ist 2026 kein Hobbyisten-Spielzeug mehr – produktionsreif ab ca. 20 Mitarbeitenden.
BLOCK 04LANDSCHAFT 2026
Warum jetzt lokal: die vier Treiber
Datenschutz
78 % des dt. Mittelstands nennen Datenschutz als Hauptargument gegen Cloud-KI. Lokale Inferenz löst das strukturell – nicht nur vertraglich.
EU AI Act
Pflichten seit 02/2025, Governance für Hochrisiko-KI ab 08/2026. Lokale Deployments erleichtern Dokumentation und Oversight.
Kosten
Cloud-Abo heute realistisch ~100 €/Monat pro KI-Account – 1.200 €/Jahr pro Nutzer. 200-MA-Firma mit 50 KI-Accounts: ~60.000 €/Jahr. Lokale Hardware: ~20.000 € einmalig.
Digitale Souveränität
Unabhängigkeit von US-Hyperscalern – politisch wie wirtschaftlich ein wachsendes Thema.
BLOCK 04LANDSCHAFT 2026
„
Modelle sind Commodities – keine Netzwerkeffekte.
- Plattformwechsel: KI ist ein Umbruch wie PC, Web, Smartphone – so einer kommt alle 10–15 Jahre.
- Dichtes Feld: Frontier-Modelle liegen eng beieinander – kein Anbieter mit Riesenvorsprung.
- Wertschöpfung wandert: weg vom Modell, hin zu Anwendung, Workflow, Integration.
Auszug aus dem Software-Netzwerk-Chat
05
BLOCK 05
Der Open-Source-Stack
BLOCK 05OPEN-SOURCE-STACK
Open Source und Open Weight: zwei Definitionen
Modell-Gewichte = die Milliarden Zahlenwerte, die im Training gelernt werden und das Modell ausmachen. Bei KI ist Open Source nicht immer dasselbe wie in der klassischen Software-Welt – darum vorab die zwei Begriffe.
OPEN SOURCE (KLASSISCH)
- Code, Trainingsdaten und Gewichte vollständig frei.
- Apache 2.0, MIT, BSD – echte freie Lizenzen.
- Reproduzierbar: gleiches Modell aus gleichen Daten.
- Kommerzielle Nutzung uneingeschränkt erlaubt.
OPEN WEIGHT (KI-TYPISCH)
- Nur die Modell-Gewichte sind offen.
- Trainingsdaten und Trainingscode bleiben oft proprietär.
- Reproduzierbarkeit eingeschränkt.
- Manche Lizenzen mit kommerziellen Einschränkungen (z. B. Llama-Lizenz).
Wenn wir hier von Open-Source-Modellen sprechen, sind meistens Open-Weight-Modelle gemeint – wichtig zu wissen.
BLOCK 05OPEN-SOURCE-STACK
Der Stack im Überblick

Fünf Schichten – von der Hardware bis zur Anwendung. Jede Schicht ist austauschbar.
BLOCK 05OPEN-SOURCE-STACK
Was läuft 2026 lokal?
| Modell | Größe (Q4) | Hardware | Stärke |
|---|
| Phi-4-Mini 3,8 B | ~2,5 GB | CPU / jede GPU | Einstieg, Edge |
| Granite 4.1 8 B | ~5 GB | RTX 4060 (8 GB) | Code, Compliance (Apache 2.0) |
| Qwen3.6 27 B | ~15 GB | RTX 3090 (24 GB) | Bestes Open-Weight-Coding |
| Gemma 4 31 B | ~19 GB | RTX 3090 / 4090 | Allrounder, multimodal |
| DeepSeek-R1 32 B | ~20 GB | RTX 3090 / 4090 | Reasoning |
BLOCK 05OPEN-SOURCE-STACK
Wie nah sind offene Modelle dran?
Artificial Analysis: anbieterunabhängige Benchmark-Plattform – neutral und aktuell.
Spitze proprietär: GPT-5.5, Claude Opus 4.7, Gemini 3.1 Pro – Intelligence Index ~57–60.
Bestes offenes Modell: Kimi K2.6 bei ~54 – nur ~5–6 Punkte Abstand zur Spitze.
Kernaussage: Offene Modelle sind keine Notlösung mehr – meine Commodity-These, mit Zahlen belegt.

Artificial Analysis – Intelligence Index, Stand 20.05.2026
BLOCK 05OPEN-SOURCE-STACK
Drei Monate hinter der Spitze, zwölf Monate ganz frei
- US-Spitzenmodelle (proprietär): die Speerspitze, jeweils frischster Stand.
- Chinesische Modelle: liegen typisch etwa drei Monate zurück.
- Voll-freie Open-Weight-Modelle: liegen typisch etwa zwölf Monate zurück.
Faustregel: Die Qualität der heutigen US-Spitzenmodelle bekomme ich in drei Monaten von chinesischen Anbietern und in zwölf Monaten von komplett freien Open-Weight-Modellen.
BLOCK 05OPEN-SOURCE-STACK
Die Modellfamilien
- IBM Granite – Apache 2.0, ISO-42001-zertifiziert: der Compliance-Champion.
- Qwen (Alibaba) – stärkste Open-Weight-Coding-Familie, Apache 2.0.
- Llama 4 (Meta) – MoE, riesiges Kontextfenster; Server-Hardware nötig, Lizenz eingeschränkt.
- Gemma 4 (Google) – seit Gemma 4 vollständig Apache 2.0.
- DeepSeek R1 – Reasoning-Spezialist, MIT-Lizenz.
- Phi-4 (Microsoft) – klein und effizient, MIT-Lizenz.
- Mistral – europäischer Anbieter, starkes DSGVO-Argument.
BLOCK 05OPEN-SOURCE-STACK
Inference-Server: Wo das Modell läuft
Ollama
„Docker für Sprachmodelle“ – ein Befehl, größte Modellbibliothek. Ideal für Desktop und Demo.
LM Studio
Grafische Oberfläche, niedrigschwellig. Der Einstieg für alle, die keine Kommandozeile wollen.
vLLM
Produktions-Champion: deutlich höherer Durchsatz bei Mehrbenutzer-Last. Für den internen KI-Server.
llama.cpp
Die Kern-Engine: beste CPU-Performance, breiteste Hardware-Unterstützung. Für Edge-Szenarien.
Alle sprechen eine OpenAI-kompatible API – ein Wechsel ist ohne Code-Änderung möglich.
BLOCK 05OPEN-SOURCE-STACK
Agent-Runtimes: OpenCode
- Open Source, MIT-Lizenz, in Go geschrieben – auf GitHub.
- Multi-Provider: 75+ Anbieter – Ollama und LM Studio lokal, Claude/Gemini/OpenAI in der Cloud.
- Tool-Use: Datei lesen/schreiben, Shell, Grep, MCP – der Agent kann denken UND handeln.
- Container-basiert: pro Projekt isoliert. Streaming via SSE – die Antwort erscheint sofort.
- Alternativen: Microsoft Agent Framework, LangGraph, CrewAI – für komplexe Multi-Agenten-Systeme.
BLOCK 05OPEN-SOURCE-STACK
Was einen Agenten zum Agenten macht
- Kein einfacher Aufruf: nicht nur ein Prompt – eine Antwort.
- Tool-Use: der Agent liest, sucht, führt aus.
- Multi-Turn & Zustand: mehrere Schritte, mit Gedächtnis über den Verlauf.
- Streaming: die Antwort entsteht sichtbar in Echtzeit.
Der Agent plant, handelt, prüft – und korrigiert sich selbst.
06
BLOCK 06
Use Case: Access-Modernisierung
BLOCK 06ACCESS-MODERNISIERUNG
„
In fast jeder Mittelstandsfirma gibt es sie: die eine Access-Datenbank, die vor 15 Jahren ‚Herr Müller aus der Buchhaltung‘ gebaut hat.
— Der Pain Point
- Geschäftskritisch: Produktionssteuerung, Vertragsverwaltung, Lager – mittendrin im Tagesgeschäft.
- Die Kernfrage: „Funktioniert seit 20 Jahren – aber wer pflegt das eigentlich noch?“
BLOCK 06ACCESS-MODERNISIERUNG
Access-Altlasten in Zahlen
- 56.000+ Unternehmen weltweit nutzen Access nachweislich (6sense) – die Dunkelziffer als Schatten-IT liegt deutlich höher.
- Support ausgelaufen: Access 2016/2019 seit 10/2025. Access 2021 endet am 13.10.2026.
- Keine Weiterentwicklung: Microsoft entwickelt Access nicht mehr aktiv weiter.
- Die Risiken: Schatten-IT, Bus-Faktor 1, schwindende Access-Entwickler, keine DSGVO-Compliance by Design.
BLOCK 06ACCESS-MODERNISIERUNG
Code-Generierung ist kein neues Versprechen
Schon 1985 warben dBASE-/Access-Vorläufer mit „STOP CODING“ – „Software schreibt Software“ ist 40 Jahre alt.
Evans zitiert einen Entwickler: „Für die Hälfte meiner Aufträge rate ich von Excel zur Datenbank – für die andere Hälfte genau andersherum.“
Die Pointe: Das Versprechen ist alt. Neu ist, dass es diesmal trägt – weil der Agent die Altanwendung erst versteht.

Konzeptmotiv im Stil einer 1985er Magazin-Anzeige
BLOCK 06ACCESS-MODERNISIERUNG
Migration: klassisch vs. KI-gestützt
| Phase | Klassisch | KI-gestützt |
|---|
| Analyse / Doku | Wochen, manuell | Stunden bis Tage |
| Spezifikation Zielsystem | Wochen | Stunden bis Tage |
| Code-Neuentwicklung | Monate | Wochen |
Realkosten klassisch: 15.000 € (einfach) bis 200.000 €+ (komplex) – mit KI 5.000 € bis 40.000 €. KI beschleunigt jeden Schritt – aber bei einer Migration müssen auch Menschen mitgenommen werden. Wer „Altlasten per Klick“ verspricht, lügt.
07
BLOCK 07
Showcase: AccessToSpecConverter
BLOCK 07SHOWCASE & LIVE-DEMO
Was ist der AccessToSpecConverter?
Web-App (Blazor): eine Access-Datenbank wird hochgeladen.
Windows-Agent extrahiert die Struktur: Tabellen, Queries, Formulare, Reports, Module, Makros.
KI-Agent analysiert – der Anwender kann im Chat nachfragen.
Antworten werden zu Spezifikationen für die neue Webanwendung.
Echter Fall heute: K&Ks eigene Access-Zeiterfassung.

Projektliste der Web-Anwendung
BLOCK 07SHOWCASE & LIVE-DEMO
Live-Demo – der Ablauf
1
Hochladen: Access-DB einspielen (Demo-DB, sanitisiert).
2
Extraktion: der Artefakt-Baum erscheint.
3
Fragen: „Erkläre die zentrale Geschäftslogik dieser Datenbank.“
4
Speichern: die Antwort wird als Spezifikation gesichert.
5
Vertiefen: „Wie modellierst du Tabelle X als REST-API?“
6
Ergebnis: ein fertiges Spec-Dokument.
08
BLOCK 08
Architektur-Walkthrough
BLOCK 08ARCHITEKTUR
Architektur im Überblick

Browser, Blazor Server, OpenCode-Container und Windows-Agent – sauber getrennte Bausteine.
BLOCK 08ARCHITEKTUR
Die Komponenten
Server
Blazor Server (.NET 10), MudBlazor-UI, EF Core / SQLite – Standard-Stack, kein Mysterium.
KI
OpenCode-Container pro Projekt isoliert. Streaming der Antworten via SSE (server-sent events).
Agent
Windows-Dienst auf Maschinen mit Access-Installation – COM-Interop braucht echtes Access.
Provider
frei wählbar: lokal (Ollama, LM Studio) oder Cloud (Claude, Gemini).
Wichtig: Die Struktur-Extraktion läuft deterministisch, ohne KI. Die KI arbeitet erst auf den exakt ausgelesenen Daten – sie rät nicht.
BLOCK 08ARCHITEKTUR
Hinter den Kulissen – der Ablauf

Vom Upload bis zur Live-Anzeige: acht Schritte, durchgehend als Stream.
BLOCK 08ARCHITEKTUR
Multi-Provider: lokal oder Cloud
Eine Abstraktion, viele Provider – der Wechsel gelingt ohne Code-Änderung.
Lokal (Ollama / LM Studio) für sensible Daten.
Cloud (Claude / Gemini) für Spitzenleistung.
Wiederverwendbar: dieses Muster trägt – nicht nur für Access.

Provider-Auswahl in der Anwendung
09
BLOCK 09
Unsere Ollama-Installation
BLOCK 09UNSERE OLLAMA-INSTALLATION
Unser eigener LLM-Server
Eigener Ollama-Server: KI-Inferenz vollständig auf eigener Hardware.
Ollama 0.23.4, OpenAI-kompatible API.
Web-Frontend (Open WebUI): ein Browser genügt – kein Cloud-Konto, teamweit nutzbar.
Kein Cloud-Provider nötig: lokal, offen, in Produktion.

Ollama-Konfiguration in der Anwendung
BLOCK 09UNSERE OLLAMA-INSTALLATION
Unser Modell-Park
- 15 Modelle aktiv, von 9 GB bis 87 GB.
- Querschnitt: gpt-oss (OpenAI), Nemotron (NVIDIA), DeepSeek-R1, Qwen3.6, Gemma 4, Granite 4.1, GLM, Phi-4.
- Vom 9-GB-Modell auf einer Consumer-GPU bis zum 87-GB-Modell auf Server-Hardware.
Vom Experiment bis zur produktiven Last – alles auf derselben offenen Plattform.
BLOCK 09UNSERE OLLAMA-INSTALLATION
Was das praktisch bedeutet
- Modellwechsel ist ein Einzeiler – verschiedene Modelle für verschiedene Aufgaben.
- Für Coding nutzen wir qwen3.6:27b – auf unserer Hardware das beste Modell unter Ollama; es kann auch den Showcase antreiben.
- Hardware-Realität: eine RTX 3090 (~1.000 €, 24 GB) ist der Preis-Leistungs-Sieger für ernsthafte lokale Modelle.
- Quantisierung Q4 macht selbst 120-B-Modelle handhabbar.
- Klein anfangen, ausbauen, wenn der Bedarf wächst.
BLOCK 09UNSERE OLLAMA-INSTALLATION
Nachhaltige KI: Strom vom eigenen Dach
Größter laufender Kostenfaktor lokaler KI ist Strom – nicht Lizenzen.
PV-Anlage Firmendach: 37,6 MWh erzeugt, 27,5 MWh verbraucht (2025).
Im Sommer autark – dann kostet lokale KI praktisch nur die Hardware-Abschreibung.
Batteriespeicher auf 45 kWh erweitert.
Datenschutzkonform UND ökologisch – Core Value „Wir agieren nachhaltig“.
Ausbaufähig: Platz für Module und Speicher; saisonale Speicherung (Wasserstoff) wird geprüft.

PV-Jahresbilanz 2025 – Ertrag vs. Verbrauch je Monat
10
BLOCK 10
Lessons Learned
BLOCK 10LESSONS LEARNED
Was wir gelernt haben
- Modellwahl ist entscheidend – unter ca. 7 B oft zu schwach für komplexe Aufgaben.
- Das Kontextfenster ist der Engpass – große Datenbanken müssen geschnitten werden.
- Streaming verändert die UX – Wartebalken sind 2025.
- Toolchain wichtiger als Modell – die Agent-Runtime macht den Unterschied.
- Vom Pilot zum Alltag ist die eigentliche Hürde – fast jede Firma hat einen KI-Piloten, wenige schaffen den Sprung.
BLOCK 10LESSONS LEARNED
Wo lokale Agenten heute glänzen
| Use Case | Lokal? | Warum |
|---|
| Codeanalyse, Spec-Erstellung | ('Ja', (0, 225, 185)) | Latenz, Datenschutz |
| Dokumenten-Q&A intern | ('Ja', (0, 225, 185)) | Datenschutz |
| Kreative Texte | ('Bedingt', (255, 102, 0)) | Modelle noch schwächer als die Cloud-Spitze |
| Stark multimodal | ('Nein', (90, 107, 128)) | Hardware-Anforderung extrem hoch |
BLOCK 10LESSONS LEARNED
Was noch nicht gut funktioniert
- Sehr lange Kontexte (über 32k) sind teuer.
- Weniger Weltwissen – lokale Modelle wissen schlicht weniger.
- Tool-Use weniger zuverlässig als bei den Cloud-Spitzenmodellen.
- Hybrid statt Vollautomatisierung ist oft realistischer (Klarna-Lektion).
Aber: Der 6-Monats-Trend ist eindeutig – die Lücke schließt sich schnell.
11
BLOCK 11
Wann lokal, wann Cloud?
BLOCK 11LOKAL ODER CLOUD
Entscheidungshilfe: lokal oder Cloud?
Höchste Qualität nötig?
JA ▸
Cloud-Spitzenmodell
Hohes Anfrage-Volumen?
JA ▸
lokal (Kosten)
BLOCK 11LOKAL ODER CLOUD
Open-Source-Stack-Empfehlung 2026
- Inference: Ollama (einfach) oder LM Studio (GUI); vLLM, wenn ein Team produktiv darauf zugreift.
- Modell: Granite 4.1 (Compliance), Qwen3.6 (Coding), Phi-4-Mini (Einstieg).
- Agent-Runtime: OpenCode.
- Orchestrierung: N8N bleibt valide; LangGraph/CrewAI für komplexe Multi-Agenten-Workflows.
BLOCK 11LOKAL ODER CLOUD
Was bedeutet das für eure IT?
1
Jetzt experimentieren: Ollama installieren, ein kleines Projekt starten.
2
Use Cases sammeln: wo könnte KI bei euch wirklich helfen?
3
Stack einfach halten: kein Big-Bang – klein anfangen.
12
BLOCK 12
Was das für euer Geschäft bedeutet
BLOCK 12GESCHÄFT IN DER KI-ZEIT
Was Software heute wirklich kostet
Code wird Massenware – Konzept und Begleitung werden zur eigentlichen Leistung.
KOSTET HEUTE (FAST) NICHTS
- Code schreiben.
- Boilerplate und Standardarchitektur.
- Tests und Deployment-Skripte.
- Generierung von Dokumentation und API.
- Routine-Änderungen und Bugfixes.
BLEIBT WERTVOLL — WIR VERDIENEN HIER
- Anforderungen verstehen und schärfen.
- Bedien- und Workflow-Konzepte gestalten.
- Datenschutz und Compliance begleiten.
- Qualität sichern und Audits bestehen.
- Betrieb verantworten, Reaktionszeiten halten.
Wir verdienen an dem, was KI nicht kann. Den Rest schenken wir.
BLOCK 12GESCHÄFT IN DER KI-ZEIT
Und das gilt auch für eure Systemhaus-Arbeit
Nicht nur die Entwickler – die klassische IT-Dienstleister-Tätigkeit verlagert sich genauso.
ÜBERNIMMT DIE KI – BALD VOLLSTÄNDIG
- Rollout von Backup, Monitoring, Security.
- Patch-Management und Standard-Updates.
- Sicherheitsanalysen und Compliance-Checks.
- Ticket-Triage und Standard-Fehlerbehebung.
- Reports, Dokumentation, Audit-Vorbereitung.
BLEIBT BEIM MENSCHEN
- „Turnschuh-Administration“ vor Ort.
- PC und Server aufstellen, Drucker entstauben.
- Vertrauensgespräche mit der Geschäftsführung.
- Verantwortung und Haftung tragen.
- Krisen-Eskalation, harte Entscheidungen.
Was nicht „Turnschuh“ ist, kann die KI – oder kann es in wenigen Monaten.
BLOCK 12GESCHÄFT IN DER KI-ZEIT
„
Noch nie war die Gelegenheit für einzelne intelligente Menschen so groß wie heute.
- Alex Karp (CEO Palantir, TBPN März 2026): Zwei Wege, eine Zukunft zu haben – Handwerkliche Fähigkeiten oder Neurodivergenz.
- Zwei Fähigkeiten zählen: sich vorstellen können, was möglich ist – und es exakt beschreiben können.
- 20–30× Multiplikator: Ein Mensch, der KI exzellent steuert, leistet, wofür klassisch ein ganzes Team gebraucht wurde.
- Hebel ist Können, nicht Kapital: Geschäftsmodelle, die vor wenigen Jahren Größe brauchten, sind heute für Einzelne erreichbar.
BLOCK 12GESCHÄFT IN DER KI-ZEIT
Eine Person, das Werk von 20.
20×
Eigene Erfahrung Mai 2026: Output eines KI-gestützten Entwicklers gegenüber klassischer Arbeitsweise.
40–50×
absehbar in den nächsten 6–12 Monaten – die Fähigkeiten der Modelle verdoppeln sich alle paar Monate.
Eine starke Person plus Vertretung trägt das Geschäft eines 30-MA-Hauses – Karps Zukunftsprofil in der Praxis.
BLOCK 12GESCHÄFT IN DER KI-ZEIT
Wer kann im KI-Beratungsgeschäft arbeiten?
- Vorstellen können, was möglich ist. Eine Lösung sehen, bevor sie da ist.
- Exakt beschreiben können. Specs schreiben, die ein anderer – Mensch oder Maschine – eindeutig versteht.
- Prozesse verstehen, nicht nur Tools. Das Fach hinter der Software.
- KI-Output kritisch prüfen. Review-Disziplin, Halluzinationen erkennen – ohne abzuschalten.
- In Komplexität strukturiert navigieren können. Probleme zerlegen, ohne den Überblick zu verlieren.
- Lernbereitschaft. Was heute richtig ist, ist in drei Monaten Standard – oder überholt.
Karps Profil in der täglichen Praxis: handwerklich oder neurodivergent – für KI-Excellenz braucht es das Zweite: Neurodivergenz.
BLOCK 12GESCHÄFT IN DER KI-ZEIT
„
Die Spezifikation hat den Wert. Der Code ist Beilage.
— Spec-Driven Development – wie wir bei K&K arbeiten
- Modelle verdoppeln ihre Fähigkeiten alle paar Monate – aus derselben Spezifikation generieren wir das System einfach neu.
- Ergebnis: ein deutlich besseres Produkt – ohne die Anforderungen erneut zu klären.
- Wer die Spezifikation besitzt, besitzt das Produkt – auch in zwölf Monaten noch.
BLOCK 12GESCHÄFT IN DER KI-ZEIT
Unser Selbstversuch: die Buchhaltung
- Ziel: 100 % unserer Buchhaltung durch KI-Agenten – wir bauen die Software dafür komplett neu auf.
- Grundlage: Grundsätze ordnungsmäßiger Buchführung (GoB), ELSTER-Schnittstelle, Umsatzsteuer-Voranmeldung, Bilanzierung – alles von Grund auf spezifiziert.
- KI-natives Design: kein bestehendes System anpassen – die KI kommt mit gewachsenen Altlasten nicht gut zurecht. Wir starten auf der grünen Wiese.
- Dogfooding: was wir im eigenen Haus laufen lassen, empfehlen wir Kunden. Was wir bei uns nicht machen, auch nicht.
Wer KI predigt, sollte sie zuerst im eigenen Backoffice einsetzen.
BLOCK 12GESCHÄFT IN DER KI-ZEIT
Das Angebot IST die Demo.
- Klassisch: Angebot bei der Ausschreibung – die Implementierung folgt Wochen oder Monate nach Zuschlag.
- KI-Zeit: die Implementierung läuft parallel zum Angebot – der Kunde sieht das fertige Ergebnis vorab.
- Beispiel: „Code im Quartier“ – wir haben das Projekt mit dem Angebot bereits umgesetzt mitgeliefert.
- Effekt: ein Wettbewerbsvorteil, den langsamere Anbieter nicht aufholen können.
BLOCK 12GESCHÄFT IN DER KI-ZEIT
Preisvorteil – konkret weitergegeben
| Klassisch | KI-gestützt (mit Marge) |
|---|
| Aufwand | 30 Tage | 1 Tag Bau + 3–4 Tage Konzept und Nacharbeit |
| Listenpreis | 30.000 € | 9.000 € (Bodenpreis: 4.000 €) |
| Marge | Standard | höher als zuvor |
| Zeit bis Live | Wochen bis Monate | wenige Tage |
BLOCK 12GESCHÄFT IN DER KI-ZEIT
Auch wir stehen unter Druck – und das ist gut so.
- Bestehende Geschäftsmodelle werden obsolet – auch unsere. Wir denken das offen mit.
- Das Rennen heißt: KI sauber beherrschen, sauber integrieren, Vorteile an den Kunden weitergeben.
- Aufgaben sukzessive shiften: intern mit Augenmaß, beim Neugeschäft kompromisslos KI-first.
- Neukundenprojekte komplett mit KI angehen – die alten Aufwandsschätzungen gelten nicht mehr.
- Wer wartet, wird von Schnelleren überholt. Mit oder ohne uns zieht der Markt weiter.
Vom Hype zur produktiven Anwendung – und dann zur Neuvermessung des ganzen Geschäfts.
13
BLOCK 13
Was ihr mitnehmt + Q&A
BLOCK 13ABSCHLUSS & Q&A
Wo K&K helfen kann
Access-Modernisierung
Alte Access-Anwendungen analysieren, spezifizieren und in moderne Webanwendungen überführen.
access-beratung.team
KI-gestützte Entwicklung
Individuelle B2B-Software – mit lokalen und Cloud-KI-Agenten im Entwicklungsprozess.
softwareentwicklung.team
ERPNext + KI
Open-Source-ERP für den Mittelstand, angereichert um KI-Funktionen.
erp-beratung.team
Auf „Wie macht ihr das genau?“: Das ist Teil unseres Beratungsangebots – schreibt mich an, wir machen Workshops dazu.