AI souveraine, sur chaque cluster.

Soverstack déploie un LLM souverain et un agent d'ops sur vos propres GPUs - automatiquement, avec le reste du cluster. Pas d'API key, pas d'exfiltration, pas de dépendance SaaS.

Ce qu'apply déploie

Trois workloads. Zéro setup manuel.

Quand vous lancez soverstack apply, la stack AI est déployée en même temps que le cluster. Définie dans workloads/regional/, comme n'importe quel autre service.

LLM souverainworkloads/regional/llm.yaml
VM avec flavor gpu-large + 200 Go de disque. Héberge Llama, Mistral, Qwen ou n'importe quel modèle open-weights. API compatible OpenAI exposée sur le mesh.
Agent d'ops (HA)workloads/regional/agent.yaml
VMs leader + standby avec profils activables : ops, observabilité, sécurité, conformité, performance, backup, customer.
Flavor GPUflavors.gpu-large
PCIe passthrough configuré au niveau Proxmox. NVIDIA / AMD / Intel - selon ce que vous avez en rack.
Intégration meshtailscale / headscale
L'AI accède à votre base, vos secrets, votre monitoring et votre stockage via le mesh chiffré. Pas de saut par l'Internet public.

llm · agent · gpu · mesh// auto-deployed by apply

Cas d'usage

Ce que les équipes construisent avec AI on board

RAG interne

Recherche et synthèse sur docs corporates, code, tickets - sans qu'un seul octet ne quitte votre périmètre.

Pair programming

Endpoint compatible OpenAI branché aux outils IDE (Continue, Aider, Cursor self-hosted). Votre code reste souverain.

Support client AI

Triage Tier-1 et rédaction de réponses entraînés sur votre base de connaissance. Données client jamais transmises à un tiers.

Automatisation ops

L'agent surveille vos métriques, suggère des décisions de scaling, rédige des runbooks, écrit les post-mortems.

Détection d'anomalies

Analyse de séries temporelles et de logs sur votre SIEM. Détectez l'inhabituel avant les alertes.

Audit conformité

Checks continus contre les contrôles ISO 27001, RGPD, HDS, HIPAA. Preuves audit-ready à la demande.

Garanties de souveraineté

Trois choses qui ne changent jamais.

Vos données ne sortent jamais

Inférence, training, fine-tuning - tout sur du matériel que vous possédez. Pas de télémétrie, pas d'inférence distante, pas de backend opaque.

Votre modèle, votre choix

Choisissez Llama, Mistral, Qwen, Gemma, ou votre propre fine-tune. Changez-le quand vous voulez en éditant workloads/regional/llm.yaml.

Conformité by design

RGPD, HDS, HIPAA-ready par défaut grâce au stockage chiffré LUKS et au mesh isolé.

Faites tourner l'AI que vous possédez.

Obtenez une démo live du LLM et de l'agent dans un vrai cluster.

Réserver une démo Lire la doc