Profil & Ansatz

Embedded Agentic-RAG für DACH-Robotik — Engineering-First, Capability-Compensation-validiert.

geisten ist eine drei-schichtige Open-Core-Platform: Engine (C23, statisch linkbar, ARM-NEON), Agent-Framework (Tool-Calling + RAG + ROS-2-Bridges) und Modelle (Open-Weight Y1, Custom- Distillation ab Y2, eigenes 0.7B Mamba-3 in Y3). Unsere Capability-Compensation-These — kleine LLMs + Agentic-Framework erreichen 85 % Cloud-LLM-Quality auf vertikalen Tasks bei 1/100 OpEx — wird monatlich über Geisten-Bench transparent gemessen. Audit-tauglich (ISO 26262 / IEC 62304 / MDR), DSGVO + EU-AI-Act + CRA strukturell ohne Cloud-Konflikt.

Wie wir arbeiten

Spezialisiert, nicht generisch. Engagement-Lieferung, nicht Beratung-auf-Stunde.

Wir adressieren Engineering-Teams, die einen konkreten Embedded-LLM-Use-Case haben und in 3–7 Wochen ein produktionsreifes Ergebnis brauchen. Unser Werkzeug ist eine spezialisierte Inferenz-Engine plus Engagement-Tier mit Festpreis — kein offenes Stundenkontingent, keine generische AI-Strategie-Beratung.

Klarheit

Wir starten beim konkreten Use-Case, nicht bei generischer AI-Strategie

Ziel-Hardware (ARM-CPU, < 4 GB RAM), Modell-Familie (Qwen3, Gemma 3, Llama 3.2, Phi-3-mini), Use-Case-Profil (Konfiguration, Diagnose, Multi-Step, Async) und Latenz-Anforderung. Daraus leitet sich der passende Engagement-Tier ab.

Praxis

Wir liefern für reale Embedded-Hardware, nicht für Benchmarks

Raspberry Pi 5, Jetson Orin Nano, Rockchip RK3588, Hailo-8L, andere Cortex-A-Devices. Jedes Engagement schließt mit dokumentiertem Mess-Setup ab — Latenz-Garantie gilt im klar definierten Hardware/Memory-Profil.

Zusammenarbeit

Vom Discovery-Call zum laufenden Pilot

25-Minuten Discovery-Call, dann Festpreis-Engagement-Angebot, dann 3–7 Wochen Lieferung. 12 Monate Maintainer-Support inklusive. Kein Sales-Marathon, kein Procurement-RFP-Theater.

Leistungen

Tier 1 · Inference-Optimization

€8–15k Festpreis, 3–4 Wochen. Quantisierung + NEON-Kernel-Optimierung + Embedded-Deployment. Latenz-Garantie im dokumentierten Mess-Setup. 12 Monate Maintainer-Support inklusive.

Tier 2 · Domain-Fine-Tuning + Agentic-RAG-Deployment

€25–50k Festpreis, 6–10 Wochen. Datenkuration + QLoRA-Fine-Tuning auf Open-Weight-Basis + Agentic-RAG-Integration (Tool-Use, Domain-Index, ROS-2-/OPC-UA-Bridges) + Embedded-Deployment + Eval gegen Domain-Benchmark. Capability-Compensation-These in der Praxis.

Tier 3 · Custom-Distillation (ab Q2 2027)

€80–200k Festpreis, 12–16 Wochen. Custom-Distillation eines Kunden-Modells via HALO/CAB-Pipeline auf 0.5–1.5B kompakt. 2–4× Geschwindigkeitsvorteil vs. FP16-Baselines. IP-Übertragung optional, Royalty-Klausel bei hohen Stückzahlen.

T&M-Backup · Stundensatz

€1.500/Tag, 2–10 Tage. Für Audits, Mid-Engagement-Pivots, kleine Engineering-Hilfe. Kein Festpreis-Commitment, 5-Tage-Kündigungsfrist.

Kontakt

Erste technische Einschätzung in 3 Angaben.

Daraus lässt sich schnell ableiten, welcher Engagement-Tier für den Use-Case passt — und ob ein 25-Minuten Discovery-Call oder eine schriftliche Anfrage der bessere Erst-Schritt ist.