13+ Jahre Machine Learning

Lokale KI-Infrastruktur
für dein Unternehmen.

Sensible Daten und KI? Geht — komplett lokal, DSGVO-konform, ohne Cloud. Hardware, Modelle und Fine-Tuning aus einer Hand.

Wir bauen lokale KI-Systeme für Unternehmen.

Hardware, Open-Source Modelle & Fine-Tuning — alles aus einer Hand. DSGVO-konform, ohne Cloud, bei dir vor Ort in Wien.

01

Hardware

Optimale GPU-Konfiguration für deinen Use Case. Zusammengebaut und geliefert.

02

Installation

Open-Source Modelle lokal installiert, konfiguriert und getestet. Keine Cloud.

03

Fine-Tuning

Modelle auf deine Daten und Prozesse trainiert. Dein Business, dein Modell.

04

Beratung & Support

Technisch fundiert, herstellerunabhängig. Updates und Hilfe — remote oder vor Ort in Wien.

Unsere Lösungen.

Von der kompakten Workstation bis zur skalierbaren Serverinfrastruktur.

Starter

GPU Server

Ein einzelnes Server-Case mit GPUs. Perfekt für kleine Teams und erste KI-Projekte — Chatbots, Textanalyse, Code-Assistenten.

Business

Server Rack

Ein 19" Rack mit mehreren GPU-Servern. Für mittlere Unternehmen — Fine-Tuning, Multi-User Inferenz, RAG-Systeme.

Enterprise

Multi-Rack Cluster

4 vernetzte Racks für mittlere bis große Unternehmen. Multi-GPU Training, parallele Inferenz, volle Power.

Custom

Individuelle Infrastruktur

Berechne den ungefähren Umfang deiner lokalen KI-Infrastruktur.

10

Geschätzte Konfiguration

Modell

Dense 120B

~60 GB

VRAM

Modell + KV-Cache (128K × 10 User)

186 GB

GPUs (96GB)

2

Infrastruktur

1 Server

Geschwindigkeit

20-80 tok/s

Geschätzte Kosten

Hardware + Setup

~€32.000

Grobe Schätzung. Kontaktiere uns für ein individuelles Angebot.

Wofür Unternehmen lokale KI einsetzen.

Support

Kundensupport Automatisierung

24/7 KI-Chat der Kundenanfragen beantwortet, Tickets priorisiert und an die richtige Abteilung weiterleitet.

Vertrieb

Angebote & Proposals

Automatische Angebotserstellung aus Kundenanfragen. Preiskalkulation, Texte und Follow-ups auf Knopfdruck.

Wissen

Interner Assistent

Firmen-Wiki, SOPs, Prozesse — dein KI-Assistent kennt alles und beantwortet Mitarbeiterfragen sofort.

Dokumente

Dokumentenanalyse

Verträge prüfen, Rechnungen extrahieren, Compliance-Checks — hunderte Seiten in Sekunden analysiert.

Entwicklung

MVP Prototyping

Code-Generierung für Prototypen und interne Tools. Schneller von der Idee zum funktionierenden MVP.

Content

Texte & E-Commerce

Produktbeschreibungen, Marketing-Texte, E-Mail Entwürfe — in deinem Ton, mit deinem Branding.

Meetings

Zusammenfassungen

Meeting-Protokolle, Action Items und Entscheidungen automatisch extrahiert. Nie wieder etwas vergessen.

Analyse

Daten & Reporting

Frag deine Daten in natürlicher Sprache. Reports, Trends und Insights ohne SQL oder BI-Tool.

Branche

Branchenspezifisch

Rechtstexte, medizinische Befunde, technische Dokumentation — fine-getuned auf deine Fachsprache.

Deine Daten. Deine KI. Dein Vorteil.

DSGVO

Deine Daten verlassen nie dein Unternehmen.

Keine Cloud

Kein Vendor Lock-in. Keine laufenden API-Kosten.

Speed

Lokale GPUs. Inferenz in Millisekunden.

Kosten

Einmal zahlen. Unbegrenzt nutzen.

13+

Jahre ML

4+

Jahre LLMs

10B

MoE from scratch

E2E

HW → Train → Deploy

13+ Jahre ML-Erfahrung und ein eigenes 10B-Parameter Modell von Grund auf trainiert. Wir setzen nicht nur auf, wir verstehen jede Schicht — und bauen genau das System, das zu deinem Business passt.

01

Beratung

02

Hardware

03

Setup

04

Lieferung

Häufige Fragen.

Was kostet eine lokale KI-Lösung?

+

Je nach Anforderung zwischen ~€5.000 für eine einzelne GPU-Workstation und €500.000+ für Multi-Rack Cluster. Nutze unseren Konfigurator für eine erste Schätzung — oder kontaktiere uns für ein individuelles Angebot.

Brauche ich eine Cloud für KI?

+

Nein. Alle unsere Lösungen laufen komplett lokal auf deiner eigenen Hardware. Keine Daten verlassen dein Unternehmen — 100% DSGVO-konform. Keine laufenden API-Kosten, kein Vendor Lock-in.

Wie lange dauert das Setup?

+

Von der Erstberatung bis zur Lieferung typischerweise 2-6 Wochen. Abhängig von Komplexität und Hardware-Verfügbarkeit. Einfache Workstations können auch schneller gehen.

Welche Modelle kann ich lokal betreiben?

+

Alle gängigen Open-Source Modelle — Qwen, GLM, MiniMax, Kimi, Llama und viele mehr. Von 7B für einfache Tasks bis 1T+ für SOTA-Qualität. Wir beraten dich zum optimalen Modell für deinen Use Case.

Kann ich das Modell auf meine Daten trainieren?

+

Ja. Wir bieten Fine-Tuning auf deine Unternehmensdaten an. Das Modell lernt deine Sprache, Prozesse und Fachbegriffe — und liefert deutlich bessere Ergebnisse als ein generisches Modell.

Was passiert nach der Lieferung?

+

Wir lassen dich nicht allein. Laufender Support, Modell-Updates wenn bessere Versionen erscheinen, und Hardware-Upgrades bei Bedarf. Remote oder vor Ort in Wien.

Bereit für deine eigene KI?

Erzähl uns von deinem Use Case. Kostenlose Beratung, individuelles Angebot, vor Ort in Wien.

Antwort

Innerhalb 24h

Erstgespräch

30 min, kostenlos

Angebot

Individuell

Standort

Wien, AT

Anfrage senden

Oder direkt per E-Mail

office@inhausi.at