AI souveraine, sur chaque cluster.
Soverstack déploie un LLM souverain et un agent d'ops sur vos propres GPUs - automatiquement, avec le reste du cluster. Pas d'API key, pas d'exfiltration, pas de dépendance SaaS.
Ce qu'apply déploie
Trois workloads. Zéro setup manuel.
Quand vous lancez soverstack apply, la stack AI est déployée en même temps que le cluster. Définie dans workloads/regional/, comme n'importe quel autre service.
- LLM souverain
workloads/regional/llm.yamlVM avec flavor gpu-large + 200 Go de disque. Héberge Llama, Mistral, Qwen ou n'importe quel modèle open-weights. API compatible OpenAI exposée sur le mesh. - Agent d'ops (HA)
workloads/regional/agent.yamlVMs leader + standby avec profils activables : ops, observabilité, sécurité, conformité, performance, backup, customer. - Flavor GPU
flavors.gpu-largePCIe passthrough configuré au niveau Proxmox. NVIDIA / AMD / Intel - selon ce que vous avez en rack. - Intégration mesh
tailscale / headscaleL'AI accède à votre base, vos secrets, votre monitoring et votre stockage via le mesh chiffré. Pas de saut par l'Internet public.
Cas d'usage
Ce que les équipes construisent avec AI on board
RAG interne
Recherche et synthèse sur docs corporates, code, tickets - sans qu'un seul octet ne quitte votre périmètre.
Pair programming
Endpoint compatible OpenAI branché aux outils IDE (Continue, Aider, Cursor self-hosted). Votre code reste souverain.
Support client AI
Triage Tier-1 et rédaction de réponses entraînés sur votre base de connaissance. Données client jamais transmises à un tiers.
Automatisation ops
L'agent surveille vos métriques, suggère des décisions de scaling, rédige des runbooks, écrit les post-mortems.
Détection d'anomalies
Analyse de séries temporelles et de logs sur votre SIEM. Détectez l'inhabituel avant les alertes.
Audit conformité
Checks continus contre les contrôles ISO 27001, RGPD, HDS, HIPAA. Preuves audit-ready à la demande.
Garanties de souveraineté
Trois choses qui ne changent jamais.
Vos données ne sortent jamais
Inférence, training, fine-tuning - tout sur du matériel que vous possédez. Pas de télémétrie, pas d'inférence distante, pas de backend opaque.
Votre modèle, votre choix
Choisissez Llama, Mistral, Qwen, Gemma, ou votre propre fine-tune. Changez-le quand vous voulez en éditant workloads/regional/llm.yaml.
Conformité by design
RGPD, HDS, HIPAA-ready par défaut grâce au stockage chiffré LUKS et au mesh isolé.
Faites tourner l'AI que vous possédez.
Obtenez une démo live du LLM et de l'agent dans un vrai cluster.