From 1711d3333799c04bd3228036f33dcc0ca4842a12 Mon Sep 17 00:00:00 2001
From: root <root@island37.com>
Date: Wed, 25 Mar 2026 02:51:36 -0500
Subject: [PATCH] =?UTF-8?q?LLM=20Team=20UI=20v1.0=20=E2=80=94=20full-stack?=
 =?UTF-8?q?=20local=20AI=20orchestration=20platform?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

Features:
- 20 team modes (brainstorm, debate, consensus, red team, etc.)
- 3 autonomous pipelines (research, model eval, knowledge extraction)
- AutoResearch Lab with ratchet engine (Karpathy-inspired)
- Multi-provider support (Ollama, OpenRouter, OpenAI, Anthropic)
- Admin panel (providers, models, timeouts, OpenRouter browser)
- History panel with copy/iterate/re-pipe workflow
- Context budget system (smart truncation, safe_query, overflow recovery)
- PostgreSQL persistence (team_runs, pipeline_runs, lab_experiments, lab_trials)
- Pure Python + embedded HTML/CSS/JS, no external JS dependencies
- Inline SVG score charts in Lab monitor
- SSE streaming for real-time output
- Systemd service with auto-restart

Stack: Flask + Ollama + PostgreSQL + Bun-compatible
Hardware: RTX A4000 (16GB) + 128GB RAM

Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
---
 .gitignore           |    4 +
 llm-team-ui.service  |   14 +
 llm_team_config.json |   33 +
 llm_team_ui.py       | 3472 ++++++++++++++++++++++++++++++++++++++++++
 schema.sql           |   54 +
 5 files changed, 3577 insertions(+)
 create mode 100644 .gitignore
 create mode 100644 llm-team-ui.service
 create mode 100644 llm_team_config.json
 create mode 100644 llm_team_ui.py
 create mode 100644 schema.sql

diff --git a/.gitignore b/.gitignore
new file mode 100644
index 0000000..8b6087b
--- /dev/null
+++ b/.gitignore
@@ -0,0 +1,4 @@
+__pycache__/
+*.pyc
+.env
+*.log
diff --git a/llm-team-ui.service b/llm-team-ui.service
new file mode 100644
index 0000000..71971c9
--- /dev/null
+++ b/llm-team-ui.service
@@ -0,0 +1,14 @@
+[Unit]
+Description=LLM Team UI - Multi-model team web interface
+After=network.target ollama.service
+
+[Service]
+Type=simple
+User=root
+WorkingDirectory=/root
+ExecStart=/usr/bin/python3 /root/llm_team_ui.py
+Restart=on-failure
+RestartSec=5
+
+[Install]
+WantedBy=multi-user.target
diff --git a/llm_team_config.json b/llm_team_config.json
new file mode 100644
index 0000000..75eb7f7
--- /dev/null
+++ b/llm_team_config.json
@@ -0,0 +1,33 @@
+{
+  "providers": {
+    "ollama": {
+      "enabled": true,
+      "base_url": "http://localhost:11434",
+      "timeout": 300
+    },
+    "openrouter": {
+      "enabled": false,
+      "base_url": "https://openrouter.ai/api/v1",
+      "api_key": "",
+      "timeout": 120
+    },
+    "openai": {
+      "enabled": false,
+      "base_url": "https://api.openai.com/v1",
+      "api_key": "",
+      "timeout": 120
+    },
+    "anthropic": {
+      "enabled": false,
+      "base_url": "https://api.anthropic.com/v1",
+      "api_key": "",
+      "timeout": 120
+    }
+  },
+  "disabled_models": [],
+  "cloud_models": [],
+  "timeouts": {
+    "global": 300,
+    "per_model": {}
+  }
+}
\ No newline at end of file
diff --git a/llm_team_ui.py b/llm_team_ui.py
new file mode 100644
index 0000000..9c69331
--- /dev/null
+++ b/llm_team_ui.py
@@ -0,0 +1,3472 @@
+#!/usr/bin/env python3
+"""LLM Team UI - Web interface to configure and run multi-model teams."""
+
+import json
+import os
+import time
+import threading
+import requests
+import random
+import psycopg2
+import psycopg2.extras
+from concurrent.futures import ThreadPoolExecutor, as_completed
+from flask import Flask, render_template_string, request, jsonify, Response
+
+app = Flask(__name__)
+
+CONFIG_PATH = "/root/llm_team_config.json"
+DEFAULT_CONFIG = {
+    "providers": {
+        "ollama": {"enabled": True, "base_url": "http://localhost:11434", "timeout": 300},
+        "openrouter": {"enabled": False, "base_url": "https://openrouter.ai/api/v1", "api_key": "", "timeout": 120},
+        "openai": {"enabled": False, "base_url": "https://api.openai.com/v1", "api_key": "", "timeout": 120},
+        "anthropic": {"enabled": False, "base_url": "https://api.anthropic.com/v1", "api_key": "", "timeout": 120},
+    },
+    "disabled_models": [],
+    "cloud_models": [],
+    "timeouts": {"global": 300, "per_model": {}},
+}
+
+def load_dotenv():
+    for p in ["/root/.env", "/home/profit/.env"]:
+        if os.path.exists(p):
+            with open(p) as f:
+                for line in f:
+                    line = line.strip()
+                    if line and not line.startswith("#") and "=" in line:
+                        k, v = line.split("=", 1)
+                        os.environ.setdefault(k.strip(), v.strip())
+
+load_dotenv()
+
+def load_config():
+    if os.path.exists(CONFIG_PATH):
+        with open(CONFIG_PATH) as f:
+            cfg = json.load(f)
+        # merge any missing defaults
+        for k, v in DEFAULT_CONFIG.items():
+            cfg.setdefault(k, v)
+        for k, v in DEFAULT_CONFIG["providers"].items():
+            cfg["providers"].setdefault(k, v)
+        return cfg
+    return json.loads(json.dumps(DEFAULT_CONFIG))
+
+def save_config(cfg):
+    with open(CONFIG_PATH, "w") as f:
+        json.dump(cfg, f, indent=2)
+
+def get_api_key(provider_name):
+    cfg = load_config()
+    prov = cfg["providers"].get(provider_name, {})
+    key = prov.get("api_key", "")
+    if key:
+        return key
+    env_map = {"openrouter": "OPENROUTER_API_KEY", "openai": "OPENAI_API_KEY", "anthropic": "ANTHROPIC_API_KEY"}
+    return os.environ.get(env_map.get(provider_name, ""), "")
+
+DB_DSN = "dbname=knowledge_base user=kbuser password=IPbLBA0EQI8u4TeM2YZrbm1OAy5nSwqC host=localhost"
+
+def get_db():
+    return psycopg2.connect(DB_DSN)
+
+def save_run(mode, prompt, config_data, responses):
+    models = list({r.get("model", "") for r in responses if r.get("model")})
+    try:
+        with get_db() as conn:
+            with conn.cursor() as cur:
+                cur.execute(
+                    "INSERT INTO team_runs (mode, prompt, config, responses, models_used) VALUES (%s, %s, %s, %s, %s)",
+                    (mode, prompt, json.dumps(config_data), json.dumps(responses), models)
+                )
+            conn.commit()
+    except Exception as e:
+        print(f"[DB] save_run error: {e}")
+
+HTML = r"""
+<!DOCTYPE html>
+<html lang="en">
+<head>
+<meta charset="UTF-8">
+<meta name="viewport" content="width=device-width, initial-scale=1.0">
+<title>LLM Team</title>
+<style>
+  :root {
+    --bg: #0a0c10; --surface: #151820; --surface2: #1c2030; --border: #272d3f;
+    --text: #e4e4e7; --text2: #a1a1aa; --accent: #6366f1; --accent2: #818cf8;
+    --green: #22c55e; --orange: #f59e0b; --red: #ef4444; --blue: #3b82f6;
+    --glow: rgba(99,102,241,0.12);
+  }
+  * { box-sizing: border-box; margin: 0; padding: 0; }
+  body { font-family: 'Inter', -apple-system, sans-serif; background: var(--bg); color: var(--text); min-height: 100vh; }
+  .container { max-width: 1440px; margin: 0 auto; padding: 16px 24px; }
+  header { display: flex; align-items: center; gap: 14px; padding: 16px 0; border-bottom: 1px solid var(--border); margin-bottom: 20px; }
+  header h1 { font-size: 22px; font-weight: 700; letter-spacing: -0.5px; }
+  header h1 span { background: linear-gradient(135deg, var(--accent2), #a78bfa); -webkit-background-clip: text; -webkit-text-fill-color: transparent; }
+  header .badge { background: var(--surface2); border: 1px solid var(--border); padding: 4px 12px; border-radius: 20px; font-size: 11px; color: var(--text2); font-weight: 500; }
+  header .badge .dot { display: inline-block; width: 6px; height: 6px; border-radius: 50%; background: var(--green); margin-right: 6px; vertical-align: middle; }
+  .grid { display: grid; grid-template-columns: 420px 1fr; gap: 16px; align-items: start; }
+  .panel { background: var(--surface); border: 1px solid var(--border); border-radius: 10px; padding: 18px; }
+  .panel h2 { font-size: 11px; text-transform: uppercase; letter-spacing: 1.5px; color: var(--text2); margin-bottom: 14px; font-weight: 600; }
+  .mode-grid { display: grid; grid-template-columns: repeat(3, 1fr); gap: 5px; margin-bottom: 16px; }
+  .mode-tab { padding: 8px 6px; background: var(--surface2); border: 1.5px solid transparent; border-radius: 6px; color: var(--text2); cursor: pointer; text-align: center; font-size: 11px; font-weight: 600; transition: all 0.15s; }
+  .mode-tab:hover { border-color: var(--accent); color: var(--text); background: rgba(99,102,241,0.06); }
+  .mode-tab.active { border-color: var(--accent); background: var(--glow); color: var(--accent2); box-shadow: 0 0 12px rgba(99,102,241,0.1); }
+  .mode-tab small { display: block; font-weight: 400; font-size: 9px; margin-top: 2px; opacity: 0.6; }
+  .mode-tab.crazy { background: linear-gradient(135deg, #1a0a2e, #2d1045); }
+  .mode-tab.crazy:hover { border-color: #a855f7; }
+  .mode-tab.crazy.active { background: linear-gradient(135deg, #2d1045, #4a1a6b); border-color: #a855f7; color: #c084fc; box-shadow: 0 0 12px rgba(168,85,247,0.15); }
+  .model-list { display: flex; flex-direction: column; gap: 4px; margin-bottom: 14px; }
+  .model-card { display: flex; align-items: center; gap: 10px; padding: 7px 10px; background: var(--surface2); border: 1px solid var(--border); border-radius: 6px; cursor: pointer; transition: all 0.15s; user-select: none; }
+  .model-card:hover { border-color: rgba(99,102,241,0.4); }
+  .model-card.selected { border-color: var(--accent); background: var(--glow); }
+  .model-card .check { width: 16px; height: 16px; border: 1.5px solid var(--border); border-radius: 3px; display: flex; align-items: center; justify-content: center; font-size: 10px; flex-shrink: 0; transition: all 0.15s; }
+  .model-card.selected .check { background: var(--accent); border-color: var(--accent); color: white; }
+  .model-card .info { flex: 1; min-width: 0; }
+  .model-card .name { font-weight: 600; font-size: 12px; white-space: nowrap; overflow: hidden; text-overflow: ellipsis; }
+  .model-card .meta { font-size: 10px; color: var(--text2); }
+  .prov-badge { font-size: 8px; padding: 1px 6px; border-radius: 8px; font-weight: 600; text-transform: uppercase; letter-spacing: 0.5px; }
+  .prov-badge.ollama { background: rgba(34,197,94,0.12); color: var(--green); }
+  .prov-badge.openrouter { background: rgba(59,130,246,0.12); color: var(--blue); }
+  .prov-badge.openai { background: rgba(129,140,248,0.12); color: var(--accent2); }
+  .prov-badge.anthropic { background: rgba(236,72,153,0.12); color: #ec4899; }
+  .config-section { margin-bottom: 10px; }
+  .config-row { display: flex; gap: 8px; align-items: center; margin-bottom: 6px; font-size: 12px; }
+  .config-row label { width: 90px; color: var(--text2); flex-shrink: 0; font-weight: 500; }
+  .config-row select, .config-row input { flex: 1; background: var(--bg); border: 1px solid var(--border); color: var(--text); border-radius: 5px; padding: 6px 8px; font-size: 12px; }
+  .config-row select:focus, .config-row input:focus { outline: none; border-color: var(--accent); }
+  .pipeline-step { display: flex; align-items: center; gap: 8px; padding: 7px; margin-bottom: 4px; background: var(--surface2); border-radius: 6px; font-size: 12px; }
+  .pipeline-step .step-num { width: 22px; height: 22px; background: var(--accent); border-radius: 50%; display: flex; align-items: center; justify-content: center; font-weight: 700; font-size: 11px; flex-shrink: 0; }
+  .pipeline-step select, .pipeline-step input { background: var(--bg); border: 1px solid var(--border); color: var(--text); border-radius: 4px; padding: 4px 6px; font-size: 11px; }
+  .pipeline-step input { flex: 1; }
+  .pipeline-step .remove-step { background: none; border: none; color: var(--red); cursor: pointer; font-size: 14px; padding: 0 4px; opacity: 0.6; transition: opacity 0.15s; }
+  .pipeline-step .remove-step:hover { opacity: 1; }
+  .add-step-btn { width: 100%; padding: 7px; background: var(--surface2); border: 1px dashed var(--border); border-radius: 6px; color: var(--text2); cursor: pointer; font-size: 12px; margin-bottom: 14px; transition: all 0.15s; }
+  .add-step-btn:hover { border-color: var(--accent); color: var(--accent2); }
+  .prompt-area { width: 100%; min-height: 90px; background: var(--bg); border: 1px solid var(--border); border-radius: 8px; color: var(--text); padding: 12px; font-size: 13px; font-family: inherit; resize: vertical; margin-bottom: 10px; line-height: 1.5; }
+  .prompt-area:focus { outline: none; border-color: var(--accent); box-shadow: 0 0 0 3px rgba(99,102,241,0.1); }
+  .prompt-area::placeholder { color: var(--text2); opacity: 0.5; }
+  .run-btn { width: 100%; padding: 11px; background: linear-gradient(135deg, var(--accent), #7c3aed); color: white; border: none; border-radius: 8px; font-size: 14px; font-weight: 600; cursor: pointer; transition: all 0.2s; letter-spacing: 0.3px; }
+  .run-btn:hover { filter: brightness(1.15); transform: translateY(-1px); box-shadow: 0 4px 12px rgba(99,102,241,0.3); }
+  .run-btn:active { transform: translateY(0); }
+  .run-btn:disabled { opacity: 0.4; cursor: not-allowed; filter: none; transform: none; box-shadow: none; }
+  .output-area { display: flex; flex-direction: column; gap: 10px; }
+  .output-card { background: var(--surface2); border: 1px solid var(--border); border-radius: 8px; overflow: hidden; }
+  .output-card .card-header { display: flex; align-items: center; gap: 8px; padding: 8px 12px; border-bottom: 1px solid var(--border); font-size: 12px; font-weight: 600; }
+  .output-card .card-header .dot { width: 8px; height: 8px; border-radius: 50%; flex-shrink: 0; }
+  .output-card .card-header .role-tag { margin-left: auto; font-size: 10px; font-weight: 500; color: var(--text2); background: var(--bg); padding: 2px 8px; border-radius: 10px; }
+  .output-card .card-body { padding: 12px; font-size: 13px; line-height: 1.65; white-space: pre-wrap; max-height: 500px; overflow-y: auto; }
+  .synthesis-card { border-color: var(--accent); }
+  .synthesis-card .card-header { background: var(--glow); }
+  .crazy-card { border-color: #a855f7; }
+  .crazy-card .card-header { background: rgba(168,85,247,0.1); }
+  .status-bar { display: flex; align-items: center; gap: 8px; padding: 10px 12px; background: var(--surface2); border-radius: 8px; font-size: 12px; color: var(--text2); }
+  .spinner { width: 14px; height: 14px; border: 2px solid var(--border); border-top-color: var(--accent); border-radius: 50%; animation: spin 0.7s linear infinite; }
+  @keyframes spin { to { transform: rotate(360deg); } }
+  .empty-state { text-align: center; padding: 80px 20px; color: var(--text2); }
+  .empty-state .icon { font-size: 32px; margin-bottom: 16px; opacity: 0.3; }
+  .empty-state p { font-size: 13px; line-height: 1.6; max-width: 280px; margin: 0 auto; }
+  .empty-state p strong { color: var(--text); font-weight: 600; }
+  .mode-desc { background: var(--surface2); border-left: 2px solid var(--accent); border-radius: 0 6px 6px 0; padding: 8px 12px; font-size: 11px; color: var(--text2); margin-bottom: 14px; line-height: 1.5; }
+  .left-scroll { max-height: calc(100vh - 72px); overflow-y: auto; display: flex; flex-direction: column; gap: 12px; }
+  .left-scroll::-webkit-scrollbar { width: 4px; }
+  .left-scroll::-webkit-scrollbar-track { background: transparent; }
+  .left-scroll::-webkit-scrollbar-thumb { background: var(--border); border-radius: 4px; }
+  .left-scroll::-webkit-scrollbar-thumb:hover { background: var(--text2); }
+  .output-card .card-body::-webkit-scrollbar { width: 4px; }
+  .output-card .card-body::-webkit-scrollbar-track { background: transparent; }
+  .output-card .card-body::-webkit-scrollbar-thumb { background: var(--border); border-radius: 4px; }
+  @media (max-width: 900px) { .grid { grid-template-columns: 1fr; } }
+  .card-actions { display: flex; gap: 4px; padding: 4px 12px 8px; }
+  .card-act { background: none; border: 1px solid var(--border); border-radius: 4px; color: var(--text2); font-size: 10px; padding: 3px 8px; cursor: pointer; transition: all 0.15s; }
+  .card-act:hover { border-color: var(--accent); color: var(--accent2); }
+  .card-act.copied { border-color: var(--green); color: var(--green); }
+  .repipe-overlay { position: fixed; inset: 0; background: rgba(0,0,0,0.6); z-index: 200; display: none; align-items: center; justify-content: center; }
+  .repipe-overlay.open { display: flex; }
+  .repipe-modal { background: var(--surface); border: 1px solid var(--border); border-radius: 12px; width: 700px; max-width: 90vw; max-height: 85vh; display: flex; flex-direction: column; overflow: hidden; }
+  .repipe-header { padding: 14px 18px; border-bottom: 1px solid var(--border); display: flex; align-items: center; gap: 10px; }
+  .repipe-header h3 { font-size: 14px; flex: 1; }
+  .repipe-header .repipe-close { background: none; border: none; color: var(--text2); font-size: 18px; cursor: pointer; }
+  .repipe-body { padding: 14px 18px; overflow-y: auto; flex: 1; }
+  .repipe-text { background: var(--bg); border: 1px solid var(--border); border-radius: 8px; padding: 12px; font-size: 12px; line-height: 1.6; white-space: pre-wrap; max-height: 300px; overflow-y: auto; margin-bottom: 14px; color: var(--text); }
+  .repipe-text::-webkit-scrollbar { width: 4px; }
+  .repipe-text::-webkit-scrollbar-thumb { background: var(--border); border-radius: 4px; }
+  .repipe-actions { display: flex; flex-wrap: wrap; gap: 6px; margin-bottom: 14px; }
+  .repipe-btn { padding: 7px 14px; border: 1px solid var(--border); border-radius: 6px; background: var(--surface2); color: var(--text); cursor: pointer; font-size: 12px; font-weight: 500; transition: all 0.15s; }
+  .repipe-btn:hover { border-color: var(--accent); color: var(--accent2); }
+  .repipe-btn.primary { background: var(--accent); border-color: var(--accent); color: white; }
+  .repipe-btn.primary:hover { filter: brightness(1.15); }
+  .repipe-section { font-size: 10px; text-transform: uppercase; letter-spacing: 1.5px; color: var(--text2); margin: 12px 0 6px; font-weight: 600; }
+  .repipe-modes { display: flex; flex-wrap: wrap; gap: 4px; }
+  .repipe-mode { padding: 5px 10px; border: 1px solid var(--border); border-radius: 5px; background: var(--surface2); color: var(--text2); cursor: pointer; font-size: 11px; transition: all 0.15s; }
+  .repipe-mode:hover { border-color: var(--accent); color: var(--text); }
+  .repipe-mode.sel { border-color: var(--accent); background: var(--glow); color: var(--accent2); }
+  .history-overlay { position: fixed; inset: 0; background: rgba(0,0,0,0.5); z-index: 90; display: none; }
+  .history-overlay.open { display: block; }
+  .history-panel { position: fixed; top: 0; right: 0; width: 480px; height: 100vh; background: var(--surface); border-left: 1px solid var(--border); z-index: 100; transform: translateX(100%); transition: transform 0.25s; overflow-y: auto; display: flex; flex-direction: column; }
+  .history-panel.open { transform: translateX(0); }
+  .history-panel::-webkit-scrollbar { width: 4px; }
+  .history-panel::-webkit-scrollbar-thumb { background: var(--border); border-radius: 4px; }
+  .hp-header { padding: 16px 18px; border-bottom: 1px solid var(--border); display: flex; align-items: center; gap: 10px; flex-shrink: 0; }
+  .hp-header h2 { font-size: 16px; font-weight: 600; flex: 1; }
+  .hp-close { background: none; border: none; color: var(--text2); font-size: 20px; cursor: pointer; padding: 4px; }
+  .hp-close:hover { color: var(--text); }
+  .hp-list { flex: 1; overflow-y: auto; padding: 8px; }
+  .hp-item { background: var(--surface2); border: 1px solid var(--border); border-radius: 8px; padding: 12px; margin-bottom: 6px; cursor: pointer; transition: border-color 0.15s; }
+  .hp-item:hover { border-color: var(--accent); }
+  .hp-item .hp-mode { font-size: 10px; text-transform: uppercase; letter-spacing: 1px; color: var(--accent2); font-weight: 600; }
+  .hp-item .hp-prompt { font-size: 13px; margin: 4px 0; white-space: nowrap; overflow: hidden; text-overflow: ellipsis; }
+  .hp-item .hp-meta { font-size: 10px; color: var(--text2); display: flex; gap: 10px; }
+  .hp-detail { padding: 12px 18px; }
+  .hp-detail .hp-back { background: none; border: none; color: var(--accent2); cursor: pointer; font-size: 12px; margin-bottom: 10px; }
+  .hp-detail .hp-actions { display: flex; gap: 6px; margin-bottom: 12px; }
+  .hp-detail .hp-btn { padding: 5px 12px; border: 1px solid var(--border); border-radius: 5px; background: var(--surface2); color: var(--text); cursor: pointer; font-size: 11px; }
+  .hp-detail .hp-btn:hover { border-color: var(--accent); }
+  .hp-detail .hp-btn-del { border-color: var(--red); color: var(--red); }
+  .hp-resp { background: var(--surface2); border: 1px solid var(--border); border-radius: 6px; margin-bottom: 6px; overflow: hidden; }
+  .hp-resp-header { padding: 6px 10px; border-bottom: 1px solid var(--border); font-size: 11px; font-weight: 600; display: flex; gap: 6px; align-items: center; }
+  .hp-resp-body { padding: 8px 10px; font-size: 12px; line-height: 1.5; white-space: pre-wrap; max-height: 200px; overflow-y: auto; }
+  @media (max-width: 768px) { .mode-grid { grid-template-columns: repeat(2, 1fr); } .container { padding: 12px; } .history-panel { width: 100%; } }
+</style>
+</head>
+<body>
+<div class="container">
+  <header>
+    <h1><span>LLM</span> Team</h1>
+    <div class="badge" id="model-count"><span class="dot"></span>0 models</div>
+    <div style="margin-left:auto;display:flex;gap:6px">
+      <button onclick="toggleHistory()" style="color:var(--text2);background:none;font-size:12px;padding:4px 10px;border:1px solid var(--border);border-radius:6px;cursor:pointer;">History</button>
+      <a href="/lab" style="color:var(--green);text-decoration:none;font-size:12px;padding:4px 10px;border:1px solid rgba(34,197,94,0.3);border-radius:6px;">Lab</a>
+      <a href="/admin" style="color:var(--text2);text-decoration:none;font-size:12px;padding:4px 10px;border:1px solid var(--border);border-radius:6px;">Admin</a>
+    </div>
+  </header>
+  <div class="grid">
+    <div class="left-scroll">
+      <div class="panel">
+        <h2>Mode</h2>
+        <div class="mode-grid">
+          <div class="mode-tab active" data-mode="brainstorm" onclick="setMode('brainstorm')">Brainstorm<small>All + synthesize</small></div>
+          <div class="mode-tab" data-mode="pipeline" onclick="setMode('pipeline')">Pipeline<small>Chain sequence</small></div>
+          <div class="mode-tab" data-mode="debate" onclick="setMode('debate')">Debate<small>Argue + judge</small></div>
+          <div class="mode-tab" data-mode="validator" onclick="setMode('validator')">Validator<small>Fact-check</small></div>
+          <div class="mode-tab" data-mode="roundrobin" onclick="setMode('roundrobin')">Round Robin<small>Iterate improve</small></div>
+          <div class="mode-tab" data-mode="redteam" onclick="setMode('redteam')">Red Team<small>Attack + defend</small></div>
+          <div class="mode-tab" data-mode="consensus" onclick="setMode('consensus')">Consensus<small>Converge</small></div>
+          <div class="mode-tab" data-mode="codereview" onclick="setMode('codereview')">Code Review<small>Write+review+test</small></div>
+          <div class="mode-tab" data-mode="ladder" onclick="setMode('ladder')">ELI Ladder<small>5 levels</small></div>
+          <div class="mode-tab" data-mode="tournament" onclick="setMode('tournament')">Tournament<small>Compete + vote</small></div>
+          <div class="mode-tab" data-mode="evolution" onclick="setMode('evolution')">Evolution<small>Genetic algo</small></div>
+          <div class="mode-tab" data-mode="blindassembly" onclick="setMode('blindassembly')">Blind Assembly<small>Split + merge</small></div>
+          <div class="mode-tab" data-mode="staircase" onclick="setMode('staircase')">Staircase<small>Add constraints</small></div>
+          <div class="mode-tab" data-mode="drift" onclick="setMode('drift')">Drift Detect<small>Confidence map</small></div>
+          <div class="mode-tab" data-mode="mesh" onclick="setMode('mesh')">Perspective<small>Stakeholder 360</small></div>
+          <div class="mode-tab" data-mode="hallucination" onclick="setMode('hallucination')">Hallucinate?<small>Claim verify</small></div>
+          <div class="mode-tab crazy" data-mode="timeloop" onclick="setMode('timeloop')">Time Loop<small>Catastrophe fix!</small></div>
+        </div>
+        <div style="font-size:9px;text-transform:uppercase;letter-spacing:2px;color:var(--text2);margin:-8px 0 8px;opacity:0.5">Autonomous Pipelines</div>
+        <div class="mode-grid" style="grid-template-columns:repeat(3,1fr);margin-bottom:16px">
+          <div class="mode-tab" data-mode="research" onclick="setMode('research')" style="border-color:var(--green);border-width:1px">Research<small>Auto brief</small></div>
+          <div class="mode-tab" data-mode="eval" onclick="setMode('eval')" style="border-color:var(--orange);border-width:1px">Model Eval<small>Benchmark</small></div>
+          <div class="mode-tab" data-mode="extract" onclick="setMode('extract')" style="border-color:var(--blue);border-width:1px">Knowledge<small>Extract facts</small></div>
+        </div>
+        <div class="mode-desc" id="mode-desc">All models answer in parallel, then one synthesizes the best parts into a final answer.</div>
+
+        <!-- BRAINSTORM -->
+        <div id="config-brainstorm" class="config-section">
+          <h2>Models</h2>
+          <div class="model-list" id="ml-brainstorm"></div>
+          <div class="config-row"><label>Synthesizer</label><select id="synthesizer"></select></div>
+        </div>
+        <!-- PIPELINE -->
+        <div id="config-pipeline" class="config-section" style="display:none">
+          <h2>Pipeline Steps</h2>
+          <div id="pipeline-steps"></div>
+          <button class="add-step-btn" onclick="addPipelineStep()">+ Add Step</button>
+        </div>
+        <!-- DEBATE -->
+        <div id="config-debate" class="config-section" style="display:none">
+          <h2>Setup</h2>
+          <div class="config-row"><label>Debater 1</label><select id="debater1"></select></div>
+          <div class="config-row"><label>Debater 2</label><select id="debater2"></select></div>
+          <div class="config-row"><label>Judge</label><select id="debate-judge"></select></div>
+          <div class="config-row"><label>Rounds</label><input type="number" id="debate-rounds" value="2" min="1" max="5" style="width:60px;flex:none"></div>
+        </div>
+        <!-- VALIDATOR -->
+        <div id="config-validator" class="config-section" style="display:none">
+          <h2>Setup</h2>
+          <div class="config-row"><label>Answerer</label><select id="validator-answerer"></select></div>
+          <h2 style="margin-top:12px">Validators</h2>
+          <div class="model-list" id="ml-validator"></div>
+        </div>
+        <!-- ROUND ROBIN -->
+        <div id="config-roundrobin" class="config-section" style="display:none">
+          <h2>Models</h2>
+          <div class="model-list" id="ml-roundrobin"></div>
+          <div class="config-row"><label>Cycles</label><input type="number" id="roundrobin-cycles" value="2" min="1" max="5" style="width:60px;flex:none"></div>
+        </div>
+        <!-- RED TEAM -->
+        <div id="config-redteam" class="config-section" style="display:none">
+          <h2>Setup</h2>
+          <div class="config-row"><label>Author</label><select id="redteam-author"></select></div>
+          <div class="config-row"><label>Attacker</label><select id="redteam-attacker"></select></div>
+          <div class="config-row"><label>Patcher</label><select id="redteam-patcher"></select></div>
+          <div class="config-row"><label>Rounds</label><input type="number" id="redteam-rounds" value="2" min="1" max="5" style="width:60px;flex:none"></div>
+        </div>
+        <!-- CONSENSUS -->
+        <div id="config-consensus" class="config-section" style="display:none">
+          <h2>Models</h2>
+          <div class="model-list" id="ml-consensus"></div>
+          <div class="config-row"><label>Max Rounds</label><input type="number" id="consensus-rounds" value="3" min="1" max="5" style="width:60px;flex:none"></div>
+        </div>
+        <!-- CODE REVIEW -->
+        <div id="config-codereview" class="config-section" style="display:none">
+          <h2>Setup</h2>
+          <div class="config-row"><label>Coder</label><select id="codereview-coder"></select></div>
+          <div class="config-row"><label>Reviewer</label><select id="codereview-reviewer"></select></div>
+          <div class="config-row"><label>Tester</label><select id="codereview-tester"></select></div>
+        </div>
+        <!-- LADDER -->
+        <div id="config-ladder" class="config-section" style="display:none">
+          <h2>Models (rotated across 5 levels)</h2>
+          <div class="model-list" id="ml-ladder"></div>
+        </div>
+        <!-- TOURNAMENT -->
+        <div id="config-tournament" class="config-section" style="display:none">
+          <h2>Competitors</h2>
+          <div class="model-list" id="ml-tournament"></div>
+          <div class="config-row"><label>Judge</label><select id="tournament-judge"></select></div>
+        </div>
+        <!-- EVOLUTION -->
+        <div id="config-evolution" class="config-section" style="display:none">
+          <h2>Gene Pool (models)</h2>
+          <div class="model-list" id="ml-evolution"></div>
+          <div class="config-row"><label>Generations</label><input type="number" id="evolution-gens" value="3" min="1" max="5" style="width:60px;flex:none"></div>
+          <div class="config-row"><label>Fitness Judge</label><select id="evolution-judge"></select></div>
+        </div>
+        <!-- BLIND ASSEMBLY -->
+        <div id="config-blindassembly" class="config-section" style="display:none">
+          <h2>Workers (each gets a sub-task)</h2>
+          <div class="model-list" id="ml-blindassembly"></div>
+          <div class="config-row"><label>Assembler</label><select id="blind-assembler"></select></div>
+        </div>
+        <!-- STAIRCASE -->
+        <div id="config-staircase" class="config-section" style="display:none">
+          <h2>Setup</h2>
+          <div class="config-row"><label>Answerer</label><select id="staircase-answerer"></select></div>
+          <div class="config-row"><label>Challenger</label><select id="staircase-challenger"></select></div>
+          <div class="config-row"><label>Steps</label><input type="number" id="staircase-steps" value="4" min="2" max="8" style="width:60px;flex:none"></div>
+        </div>
+        <!-- DRIFT -->
+        <div id="config-drift" class="config-section" style="display:none">
+          <h2>Setup</h2>
+          <div class="config-row"><label>Target Model</label><select id="drift-target"></select></div>
+          <div class="config-row"><label>Samples</label><input type="number" id="drift-samples" value="5" min="3" max="10" style="width:60px;flex:none"></div>
+          <div class="config-row"><label>Analyzer</label><select id="drift-analyzer"></select></div>
+        </div>
+        <!-- MESH -->
+        <div id="config-mesh" class="config-section" style="display:none">
+          <h2>Models (rotated across perspectives)</h2>
+          <div class="model-list" id="ml-mesh"></div>
+          <div class="config-row"><label>Synthesizer</label><select id="mesh-synthesizer"></select></div>
+        </div>
+        <!-- HALLUCINATION -->
+        <div id="config-hallucination" class="config-section" style="display:none">
+          <h2>Setup</h2>
+          <div class="config-row"><label>Answerer</label><select id="halluc-answerer"></select></div>
+          <h2 style="margin-top:12px">Hunters</h2>
+          <div class="model-list" id="ml-hallucination"></div>
+        </div>
+        <!-- TIME LOOP -->
+        <div id="config-timeloop" class="config-section" style="display:none">
+          <h2>Setup</h2>
+          <div class="config-row"><label>Answerer</label><select id="timeloop-answerer"></select></div>
+          <div class="config-row"><label>Chaos Agent</label><select id="timeloop-chaos"></select></div>
+          <div class="config-row"><label>Loops</label><input type="number" id="timeloop-loops" value="4" min="2" max="8" style="width:60px;flex:none"></div>
+        </div>
+        <!-- RESEARCH PIPELINE -->
+        <div id="config-research" class="config-section" style="display:none">
+          <h2>Research Pipeline</h2>
+          <div class="config-row"><label>Scout</label><select id="research-scout"></select></div>
+          <div class="config-row"><label>Researchers</label></div>
+          <div class="model-list" id="ml-research"></div>
+          <div class="config-row"><label>Fact-checker</label><select id="research-checker"></select></div>
+          <div class="config-row"><label>Synthesizer</label><select id="research-synth"></select></div>
+          <div class="config-row"><label>Questions</label><input type="number" id="research-questions" value="5" min="3" max="15" style="width:60px;flex:none"></div>
+        </div>
+        <!-- MODEL EVAL PIPELINE -->
+        <div id="config-eval" class="config-section" style="display:none">
+          <h2>Model Evaluation</h2>
+          <div class="model-list" id="ml-eval"></div>
+          <div class="config-row"><label>Judge</label><select id="eval-judge"></select></div>
+          <div class="config-row"><label>Eval Type</label><select id="eval-type">
+            <option value="general">General Knowledge</option>
+            <option value="reasoning">Reasoning</option>
+            <option value="coding">Coding</option>
+            <option value="creative">Creative Writing</option>
+            <option value="instruction">Instruction Following</option>
+          </select></div>
+          <div class="config-row"><label>Rounds</label><input type="number" id="eval-rounds" value="3" min="1" max="10" style="width:60px;flex:none"></div>
+        </div>
+        <!-- KNOWLEDGE EXTRACTION -->
+        <div id="config-extract" class="config-section" style="display:none">
+          <h2>Knowledge Extraction</h2>
+          <div class="config-row"><label>Extractor</label><select id="extract-model"></select></div>
+          <div class="config-row"><label>Verifier</label><select id="extract-verifier"></select></div>
+          <div class="config-row"><label>Source</label><select id="extract-source">
+            <option value="prompt">From Prompt Text</option>
+            <option value="ontology">ONTOLOGY.md</option>
+            <option value="index">INDEX.md</option>
+            <option value="summaries">SUMMARIES.md</option>
+            <option value="guides">GUIDES.md</option>
+          </select></div>
+        </div>
+      </div>
+      <div class="panel">
+        <h2>Prompt</h2>
+        <textarea class="prompt-area" id="prompt" placeholder="What should your team work on?"></textarea>
+        <button class="run-btn" id="run-btn" onclick="runTeam()">Run Team</button>
+      </div>
+    </div>
+    <div class="panel">
+      <h2>Output</h2>
+      <div class="output-area" id="output">
+        <div class="empty-state"><div class="icon">&#9670; &#9670; &#9670;</div><p>Select a <strong>mode</strong>, pick your <strong>models</strong>, and enter a prompt to run the team.</p></div>
+      </div>
+    </div>
+  </div>
+</div>
+<script>
+const COLORS = ['#6366f1','#22c55e','#f59e0b','#3b82f6','#ef4444','#ec4899','#14b8a6','#f97316'];
+let availableModels = [];
+let currentMode = 'brainstorm';
+
+const modelSets = {};
+const ML_IDS = ['ml-brainstorm','ml-validator','ml-roundrobin','ml-consensus','ml-ladder','ml-tournament','ml-evolution','ml-blindassembly','ml-mesh','ml-hallucination','ml-research','ml-eval'];
+
+const MODE_DESCS = {
+  brainstorm: 'All models answer in parallel, then one synthesizes the best parts.',
+  pipeline: 'Chain models in sequence with custom instructions. Each builds on previous output.',
+  debate: 'Two models debate over rounds, a judge picks the stronger position.',
+  validator: 'One answers, multiple validators fact-check and score 1-10.',
+  roundrobin: 'Models take turns improving the answer over multiple cycles.',
+  redteam: 'Author writes, attacker finds flaws, patcher fixes. Repeats N rounds.',
+  consensus: 'All answer independently, then iterate seeing each other until they converge.',
+  codereview: 'Coder writes code, reviewer critiques, tester writes unit tests.',
+  ladder: 'Same question at 5 levels: 5yo, teenager, college, professional, PhD.',
+  tournament: 'All compete, judge ranks and refines the winner.',
+  evolution: 'Genetic algorithm! Models generate variations, fitness judge scores, best answers breed and mutate across generations.',
+  blindassembly: 'Question split into sub-parts. Each model answers ONLY their piece blind. An assembler stitches fragments into a coherent whole.',
+  staircase: "Devil's Staircase: answer the question, then each round a challenger adds a new constraint. Answerer must adapt to ALL accumulated constraints.",
+  drift: 'Same prompt sent to same model N times. Analyzer maps what is consistent (confident) vs. what varies (uncertain/hallucinated).',
+  mesh: 'Each model answers as a different stakeholder (CEO, engineer, user, regulator, competitor). One weaves a 360-degree view.',
+  hallucination: 'One answers, then hunters independently verify EACH factual claim. Cross-references to flag likely hallucinations.',
+  timeloop: 'CHAOS MODE: Model answers, then a Chaos Agent says "your answer caused a catastrophe!" and describes what went wrong. Answerer must fix it. But each fix causes a NEW catastrophe. Loop until bulletproof!',
+  research: 'AUTONOMOUS: Scout generates research questions, multiple models research in parallel, fact-checker verifies, synthesizer produces a structured brief. Full pipeline saved to DB.',
+  eval: 'AUTONOMOUS: Same prompts sent to all selected models. Judge scores each on accuracy, reasoning, clarity. Produces a ranked leaderboard across multiple rounds.',
+  extract: 'AUTONOMOUS: Extracts structured facts, entities, and relationships from text or local docs. Verifier cross-checks claims. Output saved as queryable JSON.'
+};
+
+async function loadModels() {
+  const resp = await fetch('/api/models');
+  const data = await resp.json();
+  availableModels = data.models;
+  const local = availableModels.filter(m => m.provider === 'ollama').length;
+  const cloud = availableModels.length - local;
+  const label = cloud ? local + ' local + ' + cloud + ' cloud' : availableModels.length + ' models';
+  document.getElementById('model-count').innerHTML = '<span class="dot"></span>' + label;
+  ML_IDS.forEach(id => { modelSets[id] = new Set(availableModels.map(m => m.name)); });
+  renderAllModelLists();
+  populateAllSelects();
+  initPipeline();
+}
+
+function renderModelList(listId) {
+  const list = document.getElementById(listId);
+  if (!list) return;
+  const set = modelSets[listId];
+  list.innerHTML = availableModels.map((m, i) => {
+    const sel = set.has(m.name) ? 'selected' : '';
+    const dn = m.display_name || m.name;
+    const badge = m.provider && m.provider !== 'ollama' ? ` <span class="prov-badge ${m.provider}">${m.provider_label}</span>` : '';
+    return `<div class="model-card ${sel}" onclick="toggleModelIn('${listId}','${m.name}')">
+      <div class="check">${sel ? '&#10003;' : ''}</div>
+      <div class="info"><div class="name">${dn}${badge}</div><div class="meta">${m.size}</div></div>
+      <div style="width:10px;height:10px;border-radius:50%;background:${COLORS[i%COLORS.length]}"></div>
+    </div>`;
+  }).join('');
+}
+
+function toggleModelIn(listId, name) {
+  const set = modelSets[listId];
+  if (set.has(name)) set.delete(name); else set.add(name);
+  renderModelList(listId);
+}
+
+function renderAllModelLists() { ML_IDS.forEach(renderModelList); }
+
+function populateAllSelects() {
+  const ids = ['synthesizer','debater1','debater2','debate-judge','validator-answerer',
+    'redteam-author','redteam-attacker','redteam-patcher','codereview-coder','codereview-reviewer',
+    'codereview-tester','tournament-judge','evolution-judge','blind-assembler','staircase-answerer',
+    'staircase-challenger','drift-target','drift-analyzer','mesh-synthesizer','halluc-answerer',
+    'timeloop-answerer','timeloop-chaos',
+    'research-scout','research-checker','research-synth',
+    'eval-judge','extract-model','extract-verifier'];
+  ids.forEach(id => {
+    const el = document.getElementById(id);
+    if (!el) return;
+    el.innerHTML = availableModels.map(m => `<option value="${m.name}">${m.display_name || m.name}${m.provider && m.provider!=='ollama'?' ('+m.provider_label+')':''}</option>`).join('');
+  });
+  const n = (i) => availableModels[i % availableModels.length]?.name;
+  if (availableModels.length >= 2) {
+    ['debater2','redteam-attacker','codereview-reviewer','staircase-challenger','drift-analyzer','timeloop-chaos'].forEach(id => {
+      const el = document.getElementById(id); if (el) el.value = n(1);
+    });
+  }
+  if (availableModels.length >= 3) {
+    ['debate-judge','redteam-patcher','codereview-tester'].forEach(id => {
+      const el = document.getElementById(id); if (el) el.value = n(2);
+    });
+  }
+}
+
+function setMode(mode) {
+  currentMode = mode;
+  document.querySelectorAll('.mode-tab').forEach(t => t.classList.toggle('active', t.dataset.mode === mode));
+  document.querySelectorAll('.config-section').forEach(s => s.style.display = 'none');
+  const cfg = document.getElementById('config-' + mode);
+  if (cfg) cfg.style.display = '';
+  document.getElementById('mode-desc').textContent = MODE_DESCS[mode] || '';
+}
+
+let pipelineSteps = [];
+function initPipeline() {
+  if (!availableModels.length) return;
+  const n = (i) => availableModels[i % availableModels.length].name;
+  pipelineSteps = [
+    { model: n(0), instruction: 'Draft an initial answer to: {input}' },
+    { model: n(1), instruction: 'Review and improve this draft:\n\n{input}' },
+    { model: n(2), instruction: 'Polish into a final response:\n\n{input}' },
+  ];
+  renderPipeline();
+}
+function renderPipeline() {
+  document.getElementById('pipeline-steps').innerHTML = pipelineSteps.map((step, i) => {
+    const opts = availableModels.map(m => `<option value="${m.name}" ${m.name===step.model?'selected':''}>${m.name}</option>`).join('');
+    return `<div class="pipeline-step"><div class="step-num">${i+1}</div><select onchange="pipelineSteps[${i}].model=this.value">${opts}</select><input type="text" value="${step.instruction}" onchange="pipelineSteps[${i}].instruction=this.value"><button class="remove-step" onclick="removePipelineStep(${i})">&#10005;</button></div>`;
+  }).join('');
+}
+function addPipelineStep() { pipelineSteps.push({ model: availableModels[0]?.name, instruction: 'Process: {input}' }); renderPipeline(); }
+function removePipelineStep(i) { pipelineSteps.splice(i, 1); renderPipeline(); }
+
+function getModels(listId) { return [...(modelSets[listId] || [])]; }
+function getVal(id) { const el = document.getElementById(id); return el ? el.value : ''; }
+function getNum(id) { return parseInt(getVal(id)) || 2; }
+
+function buildConfig() {
+  const prompt = document.getElementById('prompt').value.trim();
+  if (!prompt) return null;
+  let c = { mode: currentMode, prompt };
+  switch (currentMode) {
+    case 'brainstorm': c.models = getModels('ml-brainstorm'); c.synthesizer = getVal('synthesizer'); break;
+    case 'pipeline': c.steps = pipelineSteps; break;
+    case 'debate': c.debater1 = getVal('debater1'); c.debater2 = getVal('debater2'); c.judge = getVal('debate-judge'); c.rounds = getNum('debate-rounds'); break;
+    case 'validator': c.answerer = getVal('validator-answerer'); c.validators = getModels('ml-validator').filter(m => m !== c.answerer); break;
+    case 'roundrobin': c.models = getModels('ml-roundrobin'); c.cycles = getNum('roundrobin-cycles'); break;
+    case 'redteam': c.author = getVal('redteam-author'); c.attacker = getVal('redteam-attacker'); c.patcher = getVal('redteam-patcher'); c.rounds = getNum('redteam-rounds'); break;
+    case 'consensus': c.models = getModels('ml-consensus'); c.max_rounds = getNum('consensus-rounds'); break;
+    case 'codereview': c.coder = getVal('codereview-coder'); c.reviewer = getVal('codereview-reviewer'); c.tester = getVal('codereview-tester'); break;
+    case 'ladder': c.models = getModels('ml-ladder'); break;
+    case 'tournament': c.models = getModels('ml-tournament'); c.judge = getVal('tournament-judge'); break;
+    case 'evolution': c.models = getModels('ml-evolution'); c.generations = getNum('evolution-gens'); c.judge = getVal('evolution-judge'); break;
+    case 'blindassembly': c.models = getModels('ml-blindassembly'); c.assembler = getVal('blind-assembler'); break;
+    case 'staircase': c.answerer = getVal('staircase-answerer'); c.challenger = getVal('staircase-challenger'); c.steps = getNum('staircase-steps'); break;
+    case 'drift': c.target = getVal('drift-target'); c.samples = getNum('drift-samples'); c.analyzer = getVal('drift-analyzer'); break;
+    case 'mesh': c.models = getModels('ml-mesh'); c.synthesizer = getVal('mesh-synthesizer'); break;
+    case 'hallucination': c.answerer = getVal('halluc-answerer'); c.hunters = getModels('ml-hallucination').filter(m => m !== c.answerer); break;
+    case 'timeloop': c.answerer = getVal('timeloop-answerer'); c.chaos = getVal('timeloop-chaos'); c.loops = getNum('timeloop-loops'); break;
+    case 'research': c.scout = getVal('research-scout'); c.models = getModels('ml-research'); c.checker = getVal('research-checker'); c.synthesizer = getVal('research-synth'); c.num_questions = getNum('research-questions'); break;
+    case 'eval': c.models = getModels('ml-eval'); c.judge = getVal('eval-judge'); c.eval_type = getVal('eval-type'); c.rounds = getNum('eval-rounds'); break;
+    case 'extract': c.extractor = getVal('extract-model'); c.verifier = getVal('extract-verifier'); c.source = getVal('extract-source'); break;
+  }
+  return c;
+}
+
+async function runTeam() {
+  const config = buildConfig();
+  if (!config) return;
+  const btn = document.getElementById('run-btn');
+  btn.disabled = true; btn.textContent = 'Running...';
+  const output = document.getElementById('output');
+  output.innerHTML = '<div class="status-bar"><div class="spinner"></div><span>Starting team...</span></div>';
+  try {
+    const resp = await fetch('/api/run', { method: 'POST', headers: {'Content-Type': 'application/json'}, body: JSON.stringify(config) });
+    const reader = resp.body.getReader();
+    const decoder = new TextDecoder();
+    let buffer = '';
+    while (true) {
+      const {value, done} = await reader.read();
+      if (done) break;
+      buffer += decoder.decode(value, {stream: true});
+      const lines = buffer.split('\n');
+      buffer = lines.pop();
+      for (const line of lines) {
+        if (line.startsWith('data: ')) { try { handleEvent(JSON.parse(line.slice(6))); } catch(e) {} }
+      }
+    }
+  } catch(e) {
+    output.innerHTML = `<div class="status-bar" style="color:var(--red)">Error: ${e.message}</div>`;
+  }
+  btn.disabled = false; btn.textContent = 'Run Team';
+}
+
+function handleEvent(evt) {
+  const output = document.getElementById('output');
+  if (evt.type === 'clear') { output.innerHTML = ''; return; }
+  if (evt.type === 'status') {
+    let bar = output.querySelector('.status-bar');
+    if (bar) bar.querySelector('span').textContent = evt.message;
+    else output.innerHTML += `<div class="status-bar"><div class="spinner"></div><span>${evt.message}</span></div>`;
+    return;
+  }
+  if (evt.type === 'done') { const bar = output.querySelector('.status-bar'); if (bar) bar.remove(); return; }
+  if (evt.type === 'response') {
+    const bar = output.querySelector('.status-bar'); if (bar) bar.remove();
+    const mi = availableModels.findIndex(m => m.name === evt.model);
+    const color = COLORS[(mi >= 0 ? mi : 0) % COLORS.length];
+    const displayName = mi >= 0 ? (availableModels[mi].display_name || evt.model) : evt.model;
+    const hl = ['synthesis','judge','verdict','final','consensus','patcher','assembler','analyzer','survivor','mesh-360'].includes(evt.role);
+    const isCrazy = evt.role && (evt.role.includes('catastrophe') || evt.role.includes('chaos') || evt.role === 'survivor');
+    const card = document.createElement('div');
+    card.className = 'output-card' + (hl ? ' synthesis-card' : '') + (isCrazy ? ' crazy-card' : '');
+    const roleTag = evt.role ? `<span class="role-tag">${evt.role}</span>` : '';
+    const uid = 'resp-' + Date.now() + '-' + Math.random().toString(36).substr(2,4);
+    card.innerHTML = `<div class="card-header" style="cursor:pointer" onclick="openRepipe('${uid}')"><div class="dot" style="background:${color}"></div>${displayName}${roleTag}</div><div class="card-body" id="${uid}">${escapeHtml(evt.text)}</div><div class="card-actions"><button class="card-act" onclick="event.stopPropagation();copyCard('${uid}',this)">Copy</button><button class="card-act" onclick="event.stopPropagation();useAsPrompt('${uid}')">Use as Prompt</button><button class="card-act" onclick="event.stopPropagation();openRepipe('${uid}')">Iterate</button></div>`;
+    card.dataset.model = evt.model;
+    card.dataset.role = evt.role || '';
+    card.dataset.displayName = displayName;
+    output.appendChild(card);
+  }
+}
+
+function escapeHtml(t) { return t.replace(/&/g,'&amp;').replace(/</g,'&lt;').replace(/>/g,'&gt;'); }
+
+// ─── CARD ACTIONS ────────────────────────────────────
+function copyCard(uid, btn) {
+  const el = document.getElementById(uid);
+  if (!el) return;
+  navigator.clipboard.writeText(el.textContent).then(() => {
+    btn.textContent = 'Copied!';
+    btn.classList.add('copied');
+    setTimeout(() => { btn.textContent = 'Copy'; btn.classList.remove('copied'); }, 1500);
+  });
+}
+
+function useAsPrompt(uid) {
+  const el = document.getElementById(uid);
+  if (!el) return;
+  document.getElementById('prompt').value = el.textContent;
+  document.getElementById('prompt').focus();
+  document.getElementById('prompt').scrollIntoView({behavior:'smooth'});
+}
+
+let repipeText = '';
+let repipeModel = '';
+let repipeSelectedMode = '';
+
+function openRepipe(uid) {
+  const el = document.getElementById(uid);
+  if (!el) return;
+  const card = el.closest('.output-card') || el.closest('.hp-resp');
+  repipeText = el.textContent;
+  repipeModel = card?.dataset?.model || card?.dataset?.displayName || '';
+  const dn = card?.dataset?.displayname || card?.dataset?.displayName || repipeModel;
+  repipeSelectedMode = '';
+
+  const modal = document.getElementById('repipe-overlay');
+  document.getElementById('repipe-title').textContent = dn + (card?.dataset?.role ? ' (' + card.dataset.role + ')' : '');
+  document.getElementById('repipe-text').textContent = repipeText;
+  renderRepipeModes();
+  modal.classList.add('open');
+}
+
+function closeRepipe() {
+  document.getElementById('repipe-overlay').classList.remove('open');
+}
+
+function renderRepipeModes() {
+  const modes = ['brainstorm','pipeline','debate','validator','roundrobin','redteam','consensus','codereview',
+    'ladder','tournament','evolution','blindassembly','staircase','drift','mesh','hallucination','timeloop',
+    'research','eval','extract'];
+  document.getElementById('repipe-modes').innerHTML = modes.map(m =>
+    `<div class="repipe-mode ${m===repipeSelectedMode?'sel':''}" onclick="repipeSelectedMode='${m}';renderRepipeModes()">${m}</div>`
+  ).join('');
+}
+
+function repipeCopy() {
+  navigator.clipboard.writeText(repipeText);
+  const btn = event.target;
+  btn.textContent = 'Copied!';
+  setTimeout(() => btn.textContent = 'Copy to Clipboard', 1500);
+}
+
+function repipeUseAsPrompt() {
+  document.getElementById('prompt').value = repipeText;
+  closeRepipe();
+  document.getElementById('prompt').focus();
+}
+
+function repipeAppendToPrompt() {
+  const p = document.getElementById('prompt');
+  p.value = p.value ? p.value + '\n\n---\n\n' + repipeText : repipeText;
+  closeRepipe();
+  p.focus();
+}
+
+function repipeRunInMode() {
+  if (!repipeSelectedMode) return;
+  document.getElementById('prompt').value = repipeText;
+  setMode(repipeSelectedMode);
+  closeRepipe();
+  document.getElementById('prompt').scrollIntoView({behavior:'smooth'});
+}
+
+function repipeRunNow() {
+  if (!repipeSelectedMode) return;
+  document.getElementById('prompt').value = repipeText;
+  setMode(repipeSelectedMode);
+  closeRepipe();
+  setTimeout(() => runTeam(), 100);
+}
+
+// ─── HISTORY ─────────────────────────────────────────
+let historyRuns = [];
+
+function toggleHistory() {
+  const panel = document.getElementById('history-panel');
+  const overlay = document.getElementById('history-overlay');
+  const isOpen = panel.classList.contains('open');
+  if (isOpen) {
+    panel.classList.remove('open');
+    overlay.classList.remove('open');
+  } else {
+    loadHistory();
+    panel.classList.add('open');
+    overlay.classList.add('open');
+  }
+}
+
+async function loadHistory() {
+  const r = await fetch('/api/runs');
+  const data = await r.json();
+  historyRuns = data.runs || [];
+  renderHistoryList();
+}
+
+function renderHistoryList() {
+  const el = document.getElementById('hp-content');
+  if (!historyRuns.length) {
+    el.innerHTML = '<div style="text-align:center;padding:40px;color:var(--text2)">No runs saved yet. Run a team to see history here.</div>';
+    return;
+  }
+  el.innerHTML = '<div class="hp-list">' + historyRuns.map(r => {
+    const d = new Date(r.created_at);
+    const time = d.toLocaleDateString() + ' ' + d.toLocaleTimeString([], {hour:'2-digit',minute:'2-digit'});
+    const models = (r.models_used || []).length;
+    const prompt = (r.prompt || '').substring(0, 80);
+    return `<div class="hp-item" onclick="viewRun(${r.id})">
+      <div class="hp-mode">${r.mode}</div>
+      <div class="hp-prompt">${escapeHtml(prompt)}</div>
+      <div class="hp-meta"><span>${time}</span><span>${models} model${models!==1?'s':''}</span></div>
+    </div>`;
+  }).join('') + '</div>';
+}
+
+async function viewRun(id) {
+  const r = await fetch('/api/runs/' + id);
+  const run = await r.json();
+  if (run.error) return;
+  const el = document.getElementById('hp-content');
+  const responses = run.responses || [];
+  let html = '<div class="hp-detail">';
+  html += `<button class="hp-back" onclick="renderHistoryList()">&larr; Back to list</button>`;
+  html += `<div class="hp-mode" style="font-size:10px;text-transform:uppercase;letter-spacing:1px;color:var(--accent2);font-weight:600;margin-bottom:4px">${run.mode}</div>`;
+  html += `<div style="font-size:13px;margin-bottom:8px">${escapeHtml(run.prompt)}</div>`;
+  html += `<div class="hp-actions">`;
+  html += `<button class="hp-btn" onclick="rerunFromHistory(${id})">Re-run</button>`;
+  html += `<button class="hp-btn hp-btn-del" onclick="deleteRun(${id})">Delete</button>`;
+  html += `</div>`;
+  responses.forEach((resp, ri) => {
+    const mi = availableModels.findIndex(m => m.name === resp.model);
+    const color = COLORS[(mi >= 0 ? mi : 0) % COLORS.length];
+    const dn = mi >= 0 ? (availableModels[mi].display_name || resp.model) : resp.model;
+    const hid = 'hist-resp-' + id + '-' + ri;
+    html += `<div class="hp-resp" data-model="${resp.model}" data-role="${resp.role||''}" data-display-name="${dn}">
+      <div class="hp-resp-header" style="cursor:pointer" onclick="openRepipe('${hid}')"><div style="width:6px;height:6px;border-radius:50%;background:${color}"></div>${dn}${resp.role ? ' <span style="color:var(--text2);font-weight:400">'+resp.role+'</span>' : ''}</div>
+      <div class="hp-resp-body" id="${hid}">${escapeHtml(resp.text)}</div>
+      <div class="card-actions"><button class="card-act" onclick="copyCard('${hid}',this)">Copy</button><button class="card-act" onclick="useAsPrompt('${hid}');toggleHistory()">Use as Prompt</button><button class="card-act" onclick="openRepipe('${hid}')">Iterate</button></div>
+    </div>`;
+  });
+  html += '</div>';
+  el.innerHTML = html;
+}
+
+async function rerunFromHistory(id) {
+  const r = await fetch('/api/runs/' + id);
+  const run = await r.json();
+  if (!run.config) return;
+  document.getElementById('prompt').value = run.prompt || '';
+  if (run.mode) setMode(run.mode);
+  toggleHistory();
+}
+
+async function deleteRun(id) {
+  await fetch('/api/runs/' + id, {method: 'DELETE'});
+  await loadHistory();
+  renderHistoryList();
+}
+
+loadModels();
+</script>
+<div id="repipe-overlay" class="repipe-overlay" onclick="if(event.target===this)closeRepipe()">
+  <div class="repipe-modal">
+    <div class="repipe-header">
+      <h3 id="repipe-title">Response</h3>
+      <button class="repipe-close" onclick="closeRepipe()">&times;</button>
+    </div>
+    <div class="repipe-body">
+      <div class="repipe-text" id="repipe-text"></div>
+      <div class="repipe-actions">
+        <button class="repipe-btn" onclick="repipeCopy()">Copy to Clipboard</button>
+        <button class="repipe-btn" onclick="repipeUseAsPrompt()">Replace Prompt</button>
+        <button class="repipe-btn" onclick="repipeAppendToPrompt()">Append to Prompt</button>
+      </div>
+      <div class="repipe-section">Re-pipe into mode</div>
+      <div class="repipe-modes" id="repipe-modes"></div>
+      <div class="repipe-actions" style="margin-top:10px">
+        <button class="repipe-btn primary" onclick="repipeRunNow()">Run Now</button>
+        <button class="repipe-btn" onclick="repipeRunInMode()">Load &amp; Configure</button>
+      </div>
+    </div>
+  </div>
+</div>
+<div id="history-overlay" class="history-overlay" onclick="toggleHistory()"></div>
+<div id="history-panel" class="history-panel">
+  <div class="hp-header"><h2>History</h2><button class="hp-close" onclick="toggleHistory()">&times;</button></div>
+  <div id="hp-content"></div>
+</div>
+</body>
+</html>
+"""
+
+ADMIN_HTML = r"""
+<!DOCTYPE html>
+<html lang="en">
+<head>
+<meta charset="UTF-8">
+<meta name="viewport" content="width=device-width, initial-scale=1.0">
+<title>LLM Team - Admin</title>
+<style>
+  :root {
+    --bg: #0a0c10; --surface: #151820; --surface2: #1c2030; --border: #272d3f;
+    --text: #e4e4e7; --text2: #a1a1aa; --accent: #6366f1; --accent2: #818cf8;
+    --green: #22c55e; --orange: #f59e0b; --red: #ef4444; --blue: #3b82f6;
+    --glow: rgba(99,102,241,0.12);
+  }
+  * { box-sizing: border-box; margin: 0; padding: 0; }
+  body { font-family: 'Inter', -apple-system, sans-serif; background: var(--bg); color: var(--text); min-height: 100vh; }
+  .container { max-width: 1100px; margin: 0 auto; padding: 16px 24px; }
+  header { display: flex; align-items: center; gap: 14px; padding: 16px 0; border-bottom: 1px solid var(--border); margin-bottom: 20px; }
+  header h1 { font-size: 22px; font-weight: 700; letter-spacing: -0.5px; }
+  header h1 span { background: linear-gradient(135deg, var(--accent2), #a78bfa); -webkit-background-clip: text; -webkit-text-fill-color: transparent; }
+  header a { color: var(--accent2); text-decoration: none; font-size: 13px; margin-left: auto; }
+  header a:hover { text-decoration: underline; }
+  .tabs { display: flex; gap: 4px; margin-bottom: 20px; }
+  .tab { padding: 8px 16px; background: var(--surface); border: 1px solid var(--border); border-radius: 6px; color: var(--text2); cursor: pointer; font-size: 13px; font-weight: 500; transition: all 0.15s; }
+  .tab:hover { border-color: var(--accent); color: var(--text); }
+  .tab.active { border-color: var(--accent); background: var(--glow); color: var(--accent2); }
+  .tab-content { display: none; }
+  .tab-content.active { display: block; }
+  .card { background: var(--surface); border: 1px solid var(--border); border-radius: 10px; padding: 18px; margin-bottom: 12px; }
+  .card h3 { font-size: 15px; font-weight: 600; margin-bottom: 12px; display: flex; align-items: center; gap: 8px; }
+  .card h3 .prov-dot { width: 8px; height: 8px; border-radius: 50%; }
+  .row { display: flex; gap: 10px; align-items: center; margin-bottom: 10px; font-size: 13px; }
+  .row label { width: 100px; color: var(--text2); flex-shrink: 0; font-weight: 500; }
+  .row input, .row select { flex: 1; background: var(--bg); border: 1px solid var(--border); color: var(--text); border-radius: 5px; padding: 7px 10px; font-size: 13px; }
+  .row input:focus, .row select:focus { outline: none; border-color: var(--accent); }
+  .toggle { position: relative; width: 40px; height: 22px; flex-shrink: 0; }
+  .toggle input { opacity: 0; width: 0; height: 0; }
+  .toggle .slider { position: absolute; inset: 0; background: var(--border); border-radius: 22px; cursor: pointer; transition: 0.2s; }
+  .toggle .slider::before { content: ''; position: absolute; width: 16px; height: 16px; left: 3px; bottom: 3px; background: var(--text2); border-radius: 50%; transition: 0.2s; }
+  .toggle input:checked + .slider { background: var(--accent); }
+  .toggle input:checked + .slider::before { transform: translateX(18px); background: white; }
+  .btn { padding: 7px 14px; border: 1px solid var(--border); border-radius: 6px; background: var(--surface2); color: var(--text); cursor: pointer; font-size: 12px; font-weight: 500; transition: all 0.15s; }
+  .btn:hover { border-color: var(--accent); color: var(--accent2); }
+  .btn-primary { background: var(--accent); border-color: var(--accent); color: white; }
+  .btn-primary:hover { filter: brightness(1.15); }
+  .btn-sm { padding: 4px 10px; font-size: 11px; }
+  .btn-green { background: rgba(34,197,94,0.15); border-color: var(--green); color: var(--green); }
+  .btn-red { background: rgba(239,68,68,0.1); border-color: var(--red); color: var(--red); }
+  .toast { position: fixed; top: 20px; right: 20px; padding: 10px 16px; border-radius: 8px; font-size: 13px; z-index: 100; animation: fadeIn 0.2s; }
+  .toast.ok { background: rgba(34,197,94,0.15); border: 1px solid var(--green); color: var(--green); }
+  .toast.err { background: rgba(239,68,68,0.1); border: 1px solid var(--red); color: var(--red); }
+  @keyframes fadeIn { from { opacity: 0; transform: translateY(-10px); } to { opacity: 1; } }
+  .model-row { display: flex; align-items: center; gap: 10px; padding: 8px 10px; background: var(--surface2); border: 1px solid var(--border); border-radius: 6px; margin-bottom: 4px; font-size: 13px; }
+  .model-row .name { flex: 1; font-weight: 500; }
+  .model-row .meta { color: var(--text2); font-size: 11px; }
+  .search-input { width: 100%; padding: 8px 12px; background: var(--bg); border: 1px solid var(--border); border-radius: 6px; color: var(--text); font-size: 13px; margin-bottom: 12px; }
+  .search-input:focus { outline: none; border-color: var(--accent); }
+  .or-list { max-height: 500px; overflow-y: auto; }
+  .or-list::-webkit-scrollbar { width: 4px; }
+  .or-list::-webkit-scrollbar-thumb { background: var(--border); border-radius: 4px; }
+  .timeout-row { display: grid; grid-template-columns: 1fr 100px; gap: 10px; align-items: center; padding: 6px 0; font-size: 13px; border-bottom: 1px solid var(--border); }
+  .timeout-row:last-child { border: none; }
+  .timeout-row input { width: 80px; background: var(--bg); border: 1px solid var(--border); color: var(--text); border-radius: 4px; padding: 4px 8px; font-size: 12px; text-align: center; }
+  .section-title { font-size: 11px; text-transform: uppercase; letter-spacing: 1.5px; color: var(--text2); margin: 16px 0 10px; font-weight: 600; }
+  .empty { text-align: center; padding: 30px; color: var(--text2); font-size: 13px; }
+</style>
+</head>
+<body>
+<div class="container">
+  <header>
+    <h1><span>LLM</span> Team Admin</h1>
+    <a href="/">Team UI</a> <a href="/lab" style="color:var(--green)">Lab</a>
+  </header>
+  <div class="tabs">
+    <div class="tab active" onclick="switchTab('providers')">Providers</div>
+    <div class="tab" onclick="switchTab('models')">Models</div>
+    <div class="tab" onclick="switchTab('openrouter')">OpenRouter</div>
+    <div class="tab" onclick="switchTab('timeouts')">Timeouts</div>
+  </div>
+
+  <!-- PROVIDERS TAB -->
+  <div id="tab-providers" class="tab-content active">
+    <div class="card" id="prov-ollama">
+      <h3><div class="prov-dot" style="background:var(--green)"></div> Ollama (Local)
+        <label class="toggle" style="margin-left:auto"><input type="checkbox" id="ollama-enabled" checked onchange="updateProvider('ollama')"><span class="slider"></span></label></h3>
+      <div class="row"><label>Base URL</label><input id="ollama-url" value="http://localhost:11434" onchange="updateProvider('ollama')"></div>
+      <div class="row"><label>Timeout (s)</label><input id="ollama-timeout" type="number" value="300" style="width:80px;flex:none" onchange="updateProvider('ollama')">
+        <button class="btn" onclick="testProvider('ollama')">Test</button></div>
+    </div>
+    <div class="card" id="prov-openrouter">
+      <h3><div class="prov-dot" style="background:var(--blue)"></div> OpenRouter
+        <label class="toggle" style="margin-left:auto"><input type="checkbox" id="openrouter-enabled" onchange="updateProvider('openrouter')"><span class="slider"></span></label></h3>
+      <div class="row"><label>API Key</label><input id="openrouter-key" type="password" placeholder="sk-or-..." onchange="updateProvider('openrouter')">
+        <button class="btn btn-sm" onclick="toggleVis('openrouter-key')">Show</button></div>
+      <div class="row"><label>Base URL</label><input id="openrouter-url" value="https://openrouter.ai/api/v1" onchange="updateProvider('openrouter')"></div>
+      <div class="row"><label>Timeout (s)</label><input id="openrouter-timeout" type="number" value="120" style="width:80px;flex:none" onchange="updateProvider('openrouter')">
+        <button class="btn" onclick="testProvider('openrouter')">Test</button></div>
+    </div>
+    <div class="card" id="prov-openai">
+      <h3><div class="prov-dot" style="background:var(--accent2)"></div> OpenAI
+        <label class="toggle" style="margin-left:auto"><input type="checkbox" id="openai-enabled" onchange="updateProvider('openai')"><span class="slider"></span></label></h3>
+      <div class="row"><label>API Key</label><input id="openai-key" type="password" placeholder="sk-..." onchange="updateProvider('openai')">
+        <button class="btn btn-sm" onclick="toggleVis('openai-key')">Show</button></div>
+      <div class="row"><label>Base URL</label><input id="openai-url" value="https://api.openai.com/v1" onchange="updateProvider('openai')"></div>
+      <div class="row"><label>Timeout (s)</label><input id="openai-timeout" type="number" value="120" style="width:80px;flex:none" onchange="updateProvider('openai')">
+        <button class="btn" onclick="testProvider('openai')">Test</button></div>
+    </div>
+    <div class="card" id="prov-anthropic">
+      <h3><div class="prov-dot" style="background:#ec4899"></div> Anthropic
+        <label class="toggle" style="margin-left:auto"><input type="checkbox" id="anthropic-enabled" onchange="updateProvider('anthropic')"><span class="slider"></span></label></h3>
+      <div class="row"><label>API Key</label><input id="anthropic-key" type="password" placeholder="sk-ant-..." onchange="updateProvider('anthropic')">
+        <button class="btn btn-sm" onclick="toggleVis('anthropic-key')">Show</button></div>
+      <div class="row"><label>Base URL</label><input id="anthropic-url" value="https://api.anthropic.com/v1" onchange="updateProvider('anthropic')"></div>
+      <div class="row"><label>Timeout (s)</label><input id="anthropic-timeout" type="number" value="120" style="width:80px;flex:none" onchange="updateProvider('anthropic')">
+        <button class="btn" onclick="testProvider('anthropic')">Test</button></div>
+    </div>
+  </div>
+
+  <!-- MODELS TAB -->
+  <div id="tab-models" class="tab-content">
+    <div class="card">
+      <h3>Local Models (Ollama)</h3>
+      <div id="ollama-model-list"><div class="empty">Loading...</div></div>
+    </div>
+    <div class="card">
+      <h3>Cloud Models <button class="btn btn-sm btn-primary" style="margin-left:auto" onclick="showAddCloud()">+ Add Model</button></h3>
+      <div id="cloud-model-list"><div class="empty">No cloud models configured.</div></div>
+    </div>
+    <div id="add-cloud-modal" class="card" style="display:none;border-color:var(--accent)">
+      <h3>Add Cloud Model</h3>
+      <div class="row"><label>Provider</label><select id="add-cloud-prov"><option value="openrouter">OpenRouter</option><option value="openai">OpenAI</option><option value="anthropic">Anthropic</option></select></div>
+      <div class="row"><label>Model ID</label><input id="add-cloud-id" placeholder="e.g. meta-llama/llama-3-8b-instruct:free"></div>
+      <div class="row"><label>Display Name</label><input id="add-cloud-name" placeholder="e.g. Llama 3 8B Free"></div>
+      <div class="row" style="justify-content:flex-end;gap:6px">
+        <button class="btn" onclick="hideAddCloud()">Cancel</button>
+        <button class="btn btn-primary" onclick="addCloudModel()">Add</button>
+      </div>
+    </div>
+  </div>
+
+  <!-- OPENROUTER TAB -->
+  <div id="tab-openrouter" class="tab-content">
+    <div class="card">
+      <h3>Free Models on OpenRouter <button class="btn btn-primary" style="margin-left:auto" onclick="fetchORModels()">Fetch Models</button></h3>
+      <input class="search-input" id="or-search" placeholder="Search models..." oninput="filterOR()">
+      <div class="or-list" id="or-model-list"><div class="empty">Click "Fetch Models" to load the list.</div></div>
+    </div>
+  </div>
+
+  <!-- TIMEOUTS TAB -->
+  <div id="tab-timeouts" class="tab-content">
+    <div class="card">
+      <h3>Global Default</h3>
+      <div class="row"><label>Timeout (s)</label><input id="global-timeout" type="number" value="300" style="width:100px;flex:none" onchange="saveTimeouts()"></div>
+    </div>
+    <div class="card">
+      <h3>Per-Model Overrides</h3>
+      <div id="timeout-list"><div class="empty">Loading models...</div></div>
+    </div>
+  </div>
+</div>
+
+<script>
+let config = {};
+let orModels = [];
+
+async function loadConfig() {
+  const r = await fetch('/api/admin/config');
+  config = await r.json();
+  applyConfig();
+}
+
+function applyConfig() {
+  const p = config.providers || {};
+  for (const [name, prov] of Object.entries(p)) {
+    const en = document.getElementById(name+'-enabled');
+    if (en) en.checked = prov.enabled;
+    const url = document.getElementById(name+'-url');
+    if (url) url.value = prov.base_url || '';
+    const to = document.getElementById(name+'-timeout');
+    if (to) to.value = prov.timeout || 120;
+    const key = document.getElementById(name+'-key');
+    if (key && prov.api_key_set) key.placeholder = '••••••• (key set)';
+  }
+  document.getElementById('global-timeout').value = (config.timeouts||{}).global || 300;
+  loadOllamaModels();
+  renderCloudModels();
+  renderTimeouts();
+}
+
+async function loadOllamaModels() {
+  const r = await fetch('/api/admin/ollama-models');
+  const data = await r.json();
+  const el = document.getElementById('ollama-model-list');
+  if (!data.models.length) { el.innerHTML = '<div class="empty">No Ollama models found.</div>'; return; }
+  el.innerHTML = data.models.map(m => `
+    <div class="model-row">
+      <label class="toggle"><input type="checkbox" ${m.disabled?'':'checked'} onchange="toggleOllama('${m.name}',this.checked)"><span class="slider"></span></label>
+      <span class="name">${m.name}</span>
+      <span class="meta">${m.size}</span>
+    </div>`).join('');
+}
+
+function renderCloudModels() {
+  const el = document.getElementById('cloud-model-list');
+  const cms = config.cloud_models || [];
+  if (!cms.length) { el.innerHTML = '<div class="empty">No cloud models configured. Add some from the OpenRouter tab or manually.</div>'; return; }
+  el.innerHTML = cms.map((m,i) => `
+    <div class="model-row">
+      <label class="toggle"><input type="checkbox" ${m.enabled!==false?'checked':''} onchange="toggleCloud(${i},this.checked)"><span class="slider"></span></label>
+      <span class="name">${m.display_name || m.id}</span>
+      <span class="meta">${m.id.split('::')[0]}</span>
+      <button class="btn btn-sm btn-red" onclick="removeCloud(${i})">Remove</button>
+    </div>`).join('');
+}
+
+function renderTimeouts() {
+  const el = document.getElementById('timeout-list');
+  // merge all known models
+  const models = [];
+  const cms = config.cloud_models || [];
+  // we'll load from the combined /api/models
+  fetch('/api/models').then(r=>r.json()).then(data => {
+    const per = (config.timeouts||{}).per_model || {};
+    if (!data.models.length) { el.innerHTML = '<div class="empty">No models available.</div>'; return; }
+    el.innerHTML = data.models.map(m => `
+      <div class="timeout-row">
+        <span>${m.display_name || m.name} <span style="color:var(--text2);font-size:10px">(${m.provider_label})</span></span>
+        <input type="number" value="${per[m.name] || ''}" placeholder="${(config.timeouts||{}).global||300}" onchange="setModelTimeout('${m.name}',this.value)">
+      </div>`).join('');
+  });
+}
+
+async function updateProvider(name) {
+  const prov = {};
+  const en = document.getElementById(name+'-enabled');
+  if (en) prov.enabled = en.checked;
+  const url = document.getElementById(name+'-url');
+  if (url) prov.base_url = url.value;
+  const to = document.getElementById(name+'-timeout');
+  if (to) prov.timeout = parseInt(to.value) || 120;
+  const key = document.getElementById(name+'-key');
+  if (key && key.value) prov.api_key = key.value;
+  const body = {providers: {}};
+  body.providers[name] = prov;
+  await fetch('/api/admin/config', {method:'POST', headers:{'Content-Type':'application/json'}, body:JSON.stringify(body)});
+  toast('Saved');
+}
+
+async function testProvider(name) {
+  const key = document.getElementById(name+'-key');
+  const body = {provider: name};
+  if (key && key.value) body.api_key = key.value;
+  const r = await fetch('/api/admin/test-provider', {method:'POST', headers:{'Content-Type':'application/json'}, body:JSON.stringify(body)});
+  const data = await r.json();
+  toast(data.message, data.ok);
+}
+
+async function toggleOllama(name, enabled) {
+  config.disabled_models = config.disabled_models || [];
+  if (enabled) {
+    config.disabled_models = config.disabled_models.filter(m => m !== name);
+  } else {
+    if (!config.disabled_models.includes(name)) config.disabled_models.push(name);
+  }
+  await fetch('/api/admin/config', {method:'POST', headers:{'Content-Type':'application/json'},
+    body:JSON.stringify({disabled_models: config.disabled_models})});
+  toast('Model ' + (enabled ? 'enabled' : 'disabled'));
+}
+
+function toggleCloud(idx, enabled) {
+  config.cloud_models[idx].enabled = enabled;
+  saveCloudModels();
+}
+
+function removeCloud(idx) {
+  config.cloud_models.splice(idx, 1);
+  saveCloudModels();
+  renderCloudModels();
+}
+
+async function saveCloudModels() {
+  await fetch('/api/admin/config', {method:'POST', headers:{'Content-Type':'application/json'},
+    body:JSON.stringify({cloud_models: config.cloud_models})});
+  toast('Saved');
+}
+
+function showAddCloud() { document.getElementById('add-cloud-modal').style.display = ''; }
+function hideAddCloud() { document.getElementById('add-cloud-modal').style.display = 'none'; }
+
+async function addCloudModel() {
+  const prov = document.getElementById('add-cloud-prov').value;
+  const id = document.getElementById('add-cloud-id').value.trim();
+  const name = document.getElementById('add-cloud-name').value.trim();
+  if (!id) return toast('Model ID required', false);
+  config.cloud_models = config.cloud_models || [];
+  config.cloud_models.push({id: prov+'::'+id, display_name: name || id, enabled: true});
+  await saveCloudModels();
+  renderCloudModels();
+  hideAddCloud();
+  document.getElementById('add-cloud-id').value = '';
+  document.getElementById('add-cloud-name').value = '';
+}
+
+async function fetchORModels() {
+  const el = document.getElementById('or-model-list');
+  el.innerHTML = '<div class="empty">Fetching...</div>';
+  const r = await fetch('/api/admin/openrouter/models');
+  const data = await r.json();
+  orModels = data.models || [];
+  if (data.error) { el.innerHTML = '<div class="empty" style="color:var(--red)">Error: '+data.error+'</div>'; return; }
+  renderORModels();
+}
+
+function renderORModels() {
+  const q = (document.getElementById('or-search').value || '').toLowerCase();
+  const filtered = q ? orModels.filter(m => m.name.toLowerCase().includes(q) || m.id.toLowerCase().includes(q)) : orModels;
+  const el = document.getElementById('or-model-list');
+  if (!filtered.length) { el.innerHTML = '<div class="empty">No models found.</div>'; return; }
+  const existing = new Set((config.cloud_models||[]).map(m=>m.id));
+  el.innerHTML = filtered.map(m => {
+    const added = existing.has('openrouter::'+m.id);
+    const ctx = m.context_length ? (m.context_length/1000).toFixed(0)+'K' : '?';
+    return `<div class="model-row">
+      <span class="name">${m.name}</span>
+      <span class="meta">${ctx} ctx</span>
+      ${added
+        ? '<button class="btn btn-sm" disabled style="opacity:0.4">Added</button>'
+        : `<button class="btn btn-sm btn-green" onclick="addOR('${m.id}','${m.name.replace(/'/g,"\\'")}')">Add</button>`}
+    </div>`;
+  }).join('');
+}
+
+function filterOR() { renderORModels(); }
+
+async function addOR(id, name) {
+  config.cloud_models = config.cloud_models || [];
+  config.cloud_models.push({id: 'openrouter::'+id, display_name: name, enabled: true});
+  await saveCloudModels();
+  renderORModels();
+  toast('Added: ' + name);
+}
+
+async function saveTimeouts() {
+  const g = parseInt(document.getElementById('global-timeout').value) || 300;
+  config.timeouts = config.timeouts || {};
+  config.timeouts.global = g;
+  await fetch('/api/admin/config', {method:'POST', headers:{'Content-Type':'application/json'},
+    body:JSON.stringify({timeouts: config.timeouts})});
+  toast('Saved');
+}
+
+function setModelTimeout(name, val) {
+  config.timeouts = config.timeouts || {};
+  config.timeouts.per_model = config.timeouts.per_model || {};
+  if (val && parseInt(val)) {
+    config.timeouts.per_model[name] = parseInt(val);
+  } else {
+    delete config.timeouts.per_model[name];
+  }
+  saveTimeouts();
+}
+
+function toggleVis(id) {
+  const el = document.getElementById(id);
+  el.type = el.type === 'password' ? 'text' : 'password';
+}
+
+function switchTab(name) {
+  document.querySelectorAll('.tab').forEach((t,i) => t.classList.toggle('active', t.textContent.toLowerCase().includes(name.substring(0,4))));
+  document.querySelectorAll('.tab-content').forEach(c => c.classList.toggle('active', c.id === 'tab-'+name));
+  if (name === 'timeouts') renderTimeouts();
+  if (name === 'models') { loadOllamaModels(); renderCloudModels(); }
+}
+
+function toast(msg, ok=true) {
+  const t = document.createElement('div');
+  t.className = 'toast ' + (ok ? 'ok' : 'err');
+  t.textContent = msg;
+  document.body.appendChild(t);
+  setTimeout(() => t.remove(), 3000);
+}
+
+loadConfig();
+</script>
+</body>
+</html>
+"""
+
+LAB_HTML = r"""
+<!DOCTYPE html>
+<html lang="en">
+<head>
+<meta charset="UTF-8">
+<meta name="viewport" content="width=device-width, initial-scale=1.0">
+<title>LLM Team - Lab</title>
+<style>
+  :root { --bg:#0a0c10;--surface:#151820;--surface2:#1c2030;--border:#272d3f;--text:#e4e4e7;--text2:#a1a1aa;
+    --accent:#6366f1;--accent2:#818cf8;--green:#22c55e;--orange:#f59e0b;--red:#ef4444;--blue:#3b82f6;--glow:rgba(99,102,241,0.12); }
+  *{box-sizing:border-box;margin:0;padding:0}
+  body{font-family:'Inter',-apple-system,sans-serif;background:var(--bg);color:var(--text);min-height:100vh}
+  .c{max-width:1200px;margin:0 auto;padding:16px 24px}
+  header{display:flex;align-items:center;gap:14px;padding:16px 0;border-bottom:1px solid var(--border);margin-bottom:20px}
+  header h1{font-size:22px;font-weight:700;letter-spacing:-0.5px}
+  header h1 span{background:linear-gradient(135deg,var(--green),#4ade80);-webkit-background-clip:text;-webkit-text-fill-color:transparent}
+  header nav{margin-left:auto;display:flex;gap:6px}
+  header nav a{color:var(--text2);text-decoration:none;font-size:12px;padding:4px 10px;border:1px solid var(--border);border-radius:6px}
+  header nav a:hover{border-color:var(--accent);color:var(--accent2)}
+  .tabs{display:flex;gap:4px;margin-bottom:20px}
+  .tab{padding:8px 16px;background:var(--surface);border:1px solid var(--border);border-radius:6px;color:var(--text2);cursor:pointer;font-size:13px;font-weight:500;transition:all .15s}
+  .tab:hover{border-color:var(--accent);color:var(--text)}
+  .tab.active{border-color:var(--accent);background:var(--glow);color:var(--accent2)}
+  .tc{display:none}.tc.active{display:block}
+  .card{background:var(--surface);border:1px solid var(--border);border-radius:10px;padding:18px;margin-bottom:12px}
+  .card h3{font-size:15px;font-weight:600;margin-bottom:12px;display:flex;align-items:center;gap:8px}
+  .row{display:flex;gap:10px;align-items:center;margin-bottom:10px;font-size:13px}
+  .row label{width:100px;color:var(--text2);flex-shrink:0;font-weight:500}
+  .row input,.row select,.row textarea{flex:1;background:var(--bg);border:1px solid var(--border);color:var(--text);border-radius:5px;padding:7px 10px;font-size:13px;font-family:inherit}
+  .row input:focus,.row select:focus,.row textarea:focus{outline:none;border-color:var(--accent)}
+  .btn{padding:7px 14px;border:1px solid var(--border);border-radius:6px;background:var(--surface2);color:var(--text);cursor:pointer;font-size:12px;font-weight:500;transition:all .15s}
+  .btn:hover{border-color:var(--accent);color:var(--accent2)}
+  .btn-p{background:var(--accent);border-color:var(--accent);color:white}
+  .btn-p:hover{filter:brightness(1.15)}
+  .btn-g{background:rgba(34,197,94,.15);border-color:var(--green);color:var(--green)}
+  .btn-r{background:rgba(239,68,68,.1);border-color:var(--red);color:var(--red)}
+  .btn-o{background:rgba(245,158,11,.1);border-color:var(--orange);color:var(--orange)}
+  .exp-item{background:var(--surface2);border:1px solid var(--border);border-radius:8px;padding:14px;margin-bottom:8px;cursor:pointer;transition:border-color .15s}
+  .exp-item:hover{border-color:var(--accent)}
+  .exp-item .name{font-weight:600;font-size:14px}
+  .exp-item .meta{font-size:11px;color:var(--text2);display:flex;gap:12px;margin-top:4px}
+  .status-pill{display:inline-block;padding:2px 8px;border-radius:10px;font-size:10px;font-weight:600;text-transform:uppercase}
+  .status-pill.idle{background:var(--surface);color:var(--text2)}
+  .status-pill.running{background:rgba(34,197,94,.15);color:var(--green);animation:pulse 2s infinite}
+  .status-pill.paused{background:rgba(245,158,11,.15);color:var(--orange)}
+  @keyframes pulse{0%,100%{opacity:1}50%{opacity:.6}}
+  .eval-row{display:grid;grid-template-columns:1fr 1fr auto;gap:8px;margin-bottom:6px;align-items:start}
+  .eval-row textarea{min-height:50px;font-size:12px;resize:vertical}
+  .eval-row .btn{margin-top:0;flex-shrink:0;align-self:center}
+  .model-chip{display:inline-block;padding:3px 10px;border-radius:12px;font-size:11px;margin:2px;cursor:pointer;border:1px solid var(--border);transition:all .15s}
+  .model-chip:hover{border-color:var(--accent)}
+  .model-chip.sel{background:var(--glow);border-color:var(--accent);color:var(--accent2)}
+  .chart-wrap{background:var(--bg);border:1px solid var(--border);border-radius:8px;padding:12px;margin-bottom:14px;overflow:hidden}
+  .chart-wrap svg{width:100%;height:200px}
+  .trial-log{max-height:400px;overflow-y:auto}
+  .trial-log::-webkit-scrollbar{width:4px}
+  .trial-log::-webkit-scrollbar-thumb{background:var(--border);border-radius:4px}
+  .trial-item{display:flex;align-items:center;gap:8px;padding:6px 10px;font-size:12px;border-bottom:1px solid var(--border)}
+  .trial-item:last-child{border:none}
+  .trial-item .num{width:30px;color:var(--text2);font-weight:600}
+  .trial-item .diff{flex:1;color:var(--text2);white-space:nowrap;overflow:hidden;text-overflow:ellipsis}
+  .trial-item .score{font-weight:600;width:50px;text-align:right}
+  .trial-item .ind{width:8px;height:8px;border-radius:50%;flex-shrink:0}
+  .best-box{background:var(--surface2);border:1px solid var(--green);border-radius:8px;padding:12px;font-size:12px;white-space:pre-wrap;max-height:200px;overflow-y:auto}
+  .toast{position:fixed;top:20px;right:20px;padding:10px 16px;border-radius:8px;font-size:13px;z-index:100;animation:fi .2s}
+  .toast.ok{background:rgba(34,197,94,.15);border:1px solid var(--green);color:var(--green)}
+  .toast.err{background:rgba(239,68,68,.1);border:1px solid var(--red);color:var(--red)}
+  @keyframes fi{from{opacity:0;transform:translateY(-10px)}to{opacity:1}}
+  .empty{text-align:center;padding:40px;color:var(--text2);font-size:13px}
+</style>
+</head>
+<body>
+<div class="c">
+  <header>
+    <h1><span>Lab</span> AutoResearch</h1>
+    <nav><a href="/">Team UI</a><a href="/admin">Admin</a></nav>
+  </header>
+  <div class="tabs">
+    <div class="tab active" onclick="labTab('experiments')">Experiments</div>
+    <div class="tab" onclick="labTab('config')">Mutable Config</div>
+    <div class="tab" onclick="labTab('monitor')">Live Monitor</div>
+    <div class="tab" onclick="labTab('results')">Results</div>
+  </div>
+
+  <!-- EXPERIMENTS TAB -->
+  <div id="lt-experiments" class="tc active">
+    <div class="card">
+      <h3>Create Experiment <button class="btn btn-p" style="margin-left:auto" onclick="showCreate()">+ New</button></h3>
+      <div id="exp-list"><div class="empty">Loading...</div></div>
+    </div>
+    <div id="create-form" class="card" style="display:none;border-color:var(--green)">
+      <h3>New Experiment</h3>
+      <div class="row"><label>Name</label><input id="cr-name" placeholder="e.g. Prompt Optimization v1"></div>
+      <div class="row"><label>Objective</label><input id="cr-obj" placeholder="e.g. Improve answer quality for technical questions"></div>
+      <div class="row"><label>Metric</label><select id="cr-metric"><option value="quality">Quality (LLM Judge)</option><option value="accuracy">Accuracy (Match)</option><option value="speed">Speed</option></select></div>
+      <div style="font-size:11px;text-transform:uppercase;letter-spacing:1.5px;color:var(--text2);margin:12px 0 8px;font-weight:600">Model Pool</div>
+      <div id="cr-models"></div>
+      <div style="font-size:11px;text-transform:uppercase;letter-spacing:1.5px;color:var(--text2);margin:12px 0 8px;font-weight:600">Eval Cases</div>
+      <div id="cr-evals"></div>
+      <button class="btn" onclick="addEvalRow()" style="margin-bottom:12px">+ Add Eval Case</button>
+      <div class="row" style="justify-content:flex-end;gap:6px">
+        <button class="btn" onclick="hideCreate()">Cancel</button>
+        <button class="btn btn-p" onclick="createExp()">Create</button>
+      </div>
+    </div>
+  </div>
+
+  <!-- MUTABLE CONFIG TAB -->
+  <div id="lt-config" class="tc">
+    <div class="card" id="config-panel">
+      <h3>Mutable Config <span style="font-size:11px;color:var(--text2)" id="cfg-exp-name"></span></h3>
+      <div id="no-exp-cfg" class="empty">Select an experiment from the Experiments tab first.</div>
+      <div id="cfg-editor" style="display:none">
+        <div class="row"><label>System Prompt</label></div>
+        <textarea id="cfg-sysprompt" style="width:100%;min-height:100px;background:var(--bg);border:1px solid var(--border);color:var(--text);border-radius:6px;padding:10px;font-size:12px;margin-bottom:10px;font-family:inherit" placeholder="You are a helpful assistant."></textarea>
+        <div class="row"><label>Temperature</label><input id="cfg-temp" type="range" min="0" max="1.5" step="0.05" value="0.7" oninput="document.getElementById('cfg-temp-val').textContent=this.value"><span id="cfg-temp-val" style="width:30px;text-align:center;font-size:12px">0.7</span></div>
+        <div class="row"><label>Model</label><select id="cfg-model"></select></div>
+        <div class="row" style="justify-content:flex-end"><button class="btn btn-p" onclick="saveConfig()">Save Config</button></div>
+      </div>
+    </div>
+  </div>
+
+  <!-- LIVE MONITOR TAB -->
+  <div id="lt-monitor" class="tc">
+    <div class="card">
+      <h3><span id="mon-name">No Experiment Selected</span>
+        <div style="margin-left:auto;display:flex;gap:6px">
+          <button class="btn btn-g" onclick="startExp()">Start</button>
+          <button class="btn btn-o" onclick="pauseExp()">Pause</button>
+          <button class="btn btn-r" onclick="resetExp()">Reset</button>
+        </div>
+      </h3>
+      <div style="display:flex;gap:16px;margin-bottom:14px;font-size:13px">
+        <div>Status: <span class="status-pill" id="mon-status">idle</span></div>
+        <div>Trials: <strong id="mon-trials">0</strong></div>
+        <div>Best: <strong id="mon-best" style="color:var(--green)">0.0</strong>/10</div>
+        <div>Improvements: <strong id="mon-impr">0</strong></div>
+      </div>
+    </div>
+    <div class="card">
+      <h3>Score Progression</h3>
+      <div class="chart-wrap"><svg id="score-chart" viewBox="0 0 800 200"></svg></div>
+    </div>
+    <div class="card">
+      <h3>Trial Log</h3>
+      <div class="trial-log" id="trial-log"><div class="empty">Start an experiment to see trials here.</div></div>
+    </div>
+    <div class="card">
+      <h3>Best Config</h3>
+      <div class="best-box" id="best-config-display">No best config yet.</div>
+    </div>
+  </div>
+
+  <!-- RESULTS TAB -->
+  <div id="lt-results" class="tc">
+    <div class="card">
+      <h3>All Experiments</h3>
+      <div id="results-list"><div class="empty">Loading...</div></div>
+    </div>
+    <div class="card" id="result-detail" style="display:none">
+      <h3 id="res-name">Experiment</h3>
+      <div class="chart-wrap"><svg id="res-chart" viewBox="0 0 800 200"></svg></div>
+      <div class="trial-log" id="res-trials"></div>
+      <div style="margin-top:12px"><button class="btn btn-p" onclick="exportBest()">Export Best Config</button></div>
+    </div>
+  </div>
+</div>
+
+<script>
+let experiments = [], activeExp = null, activeStream = null, allModels = [], trialData = [];
+
+async function init() {
+  const r = await fetch('/api/models');
+  const d = await r.json();
+  allModels = d.models || [];
+  await loadExperiments();
+}
+
+async function loadExperiments() {
+  const r = await fetch('/api/lab/experiments');
+  const d = await r.json();
+  experiments = d.experiments || [];
+  renderExpList();
+  renderResults();
+}
+
+function renderExpList() {
+  const el = document.getElementById('exp-list');
+  if (!experiments.length) { el.innerHTML = '<div class="empty">No experiments yet. Create one to get started.</div>'; return; }
+  el.innerHTML = experiments.map(e => {
+    const rate = e.total_trials > 0 ? ((e.improvements / e.total_trials) * 100).toFixed(0) : 0;
+    return `<div class="exp-item" onclick="selectExp(${e.id})">
+      <div class="name">${e.name} <span class="status-pill ${e.status}">${e.status}</span></div>
+      <div class="meta"><span>Trials: ${e.total_trials}</span><span>Best: ${(e.best_score||0).toFixed(1)}/10</span><span>Improvements: ${e.improvements} (${rate}%)</span><span>${e.metric}</span></div>
+    </div>`;
+  }).join('');
+}
+
+async function selectExp(id) {
+  const r = await fetch('/api/lab/experiments/' + id);
+  activeExp = await r.json();
+  trialData = activeExp.trials || [];
+  updateMonitor();
+  updateConfigEditor();
+  toast('Loaded: ' + activeExp.name);
+}
+
+function updateMonitor() {
+  if (!activeExp) return;
+  document.getElementById('mon-name').textContent = activeExp.name;
+  document.getElementById('mon-status').textContent = activeExp.status;
+  document.getElementById('mon-status').className = 'status-pill ' + activeExp.status;
+  document.getElementById('mon-trials').textContent = activeExp.total_trials;
+  document.getElementById('mon-best').textContent = (activeExp.best_score || 0).toFixed(1);
+  document.getElementById('mon-impr').textContent = activeExp.improvements;
+  if (activeExp.best_config) {
+    document.getElementById('best-config-display').textContent = JSON.stringify(activeExp.best_config, null, 2);
+  }
+  renderTrialLog();
+  renderChart('score-chart', trialData);
+}
+
+function updateConfigEditor() {
+  if (!activeExp) return;
+  document.getElementById('no-exp-cfg').style.display = 'none';
+  document.getElementById('cfg-editor').style.display = '';
+  document.getElementById('cfg-exp-name').textContent = '(' + activeExp.name + ')';
+  const mc = activeExp.mutable_config || {};
+  document.getElementById('cfg-sysprompt').value = mc.system_prompt || '';
+  document.getElementById('cfg-temp').value = mc.temperature || 0.7;
+  document.getElementById('cfg-temp-val').textContent = mc.temperature || 0.7;
+  const sel = document.getElementById('cfg-model');
+  sel.innerHTML = (activeExp.models_pool || []).map(m => `<option value="${m}" ${m===mc.model?'selected':''}>${m}</option>`).join('');
+}
+
+async function saveConfig() {
+  if (!activeExp) return;
+  const mc = {
+    system_prompt: document.getElementById('cfg-sysprompt').value,
+    temperature: parseFloat(document.getElementById('cfg-temp').value),
+    model: document.getElementById('cfg-model').value,
+  };
+  await fetch('/api/lab/experiments/' + activeExp.id, {method:'PUT', headers:{'Content-Type':'application/json'}, body:JSON.stringify({mutable_config:mc})});
+  activeExp.mutable_config = mc;
+  toast('Config saved');
+}
+
+async function startExp() {
+  if (!activeExp) return toast('Select an experiment first', false);
+  await fetch('/api/lab/experiments/' + activeExp.id + '/start', {method:'POST'});
+  activeExp.status = 'running';
+  updateMonitor();
+  startStream();
+  toast('Experiment started');
+}
+
+async function pauseExp() {
+  if (!activeExp) return;
+  await fetch('/api/lab/experiments/' + activeExp.id + '/pause', {method:'POST'});
+  activeExp.status = 'paused';
+  updateMonitor();
+  toast('Experiment paused');
+}
+
+async function resetExp() {
+  if (!activeExp) return;
+  if (!confirm('Reset all trials for this experiment?')) return;
+  await fetch('/api/lab/experiments/' + activeExp.id + '/reset', {method:'POST'});
+  trialData = [];
+  activeExp.total_trials = 0;
+  activeExp.improvements = 0;
+  activeExp.best_score = 0;
+  activeExp.status = 'idle';
+  updateMonitor();
+  toast('Experiment reset');
+}
+
+function startStream() {
+  if (activeStream) activeStream.close();
+  if (!activeExp) return;
+  const es = new EventSource('/api/lab/experiments/' + activeExp.id + '/stream');
+  activeStream = es;
+  es.onmessage = function(e) {
+    const d = JSON.parse(e.data);
+    if (d.type === 'trial') {
+      trialData.push(d);
+      activeExp.total_trials = d.trial;
+      activeExp.best_score = d.best;
+      if (d.improved) activeExp.improvements = (activeExp.improvements||0) + 1;
+      updateMonitor();
+    } else if (d.type === 'done') {
+      activeExp.status = 'paused';
+      updateMonitor();
+      es.close();
+    } else if (d.type === 'error') {
+      toast(d.message, false);
+    }
+  };
+  es.onerror = function() { es.close(); };
+}
+
+function renderTrialLog() {
+  const el = document.getElementById('trial-log');
+  if (!trialData.length) { el.innerHTML = '<div class="empty">No trials yet.</div>'; return; }
+  el.innerHTML = trialData.slice(-50).reverse().map(t =>
+    `<div class="trial-item">
+      <div class="ind" style="background:${t.improved?'var(--green)':'var(--red)'}"></div>
+      <div class="num">#${t.trial}</div>
+      <div class="diff">${t.diff || 'no change'}</div>
+      <div class="score" style="color:${t.improved?'var(--green)':'var(--text2)'}">${t.score.toFixed(1)}</div>
+    </div>`
+  ).join('');
+  el.scrollTop = 0;
+}
+
+function renderChart(svgId, trials) {
+  const svg = document.getElementById(svgId);
+  if (!trials.length) { svg.innerHTML = '<text x="400" y="100" text-anchor="middle" fill="#a1a1aa" font-size="14">No data yet</text>'; return; }
+  const w = 800, h = 200, pad = 30;
+  const maxScore = 10, minScore = 0;
+  const pts = trials.map((t, i) => {
+    const x = pad + (i / Math.max(trials.length - 1, 1)) * (w - pad * 2);
+    const y = h - pad - ((t.score - minScore) / (maxScore - minScore)) * (h - pad * 2);
+    return {x, y, score: t.score, improved: t.improved, trial: t.trial};
+  });
+  // Best score line
+  const bestY = h - pad - ((Math.max(...trials.map(t=>t.best||t.score)) - minScore) / (maxScore - minScore)) * (h - pad * 2);
+  let html = `<line x1="${pad}" y1="${bestY}" x2="${w-pad}" y2="${bestY}" stroke="#22c55e" stroke-width="1" stroke-dasharray="4,4" opacity="0.4"/>`;
+  // Score line
+  const line = pts.map(p => `${p.x},${p.y}`).join(' ');
+  html += `<polyline points="${line}" fill="none" stroke="var(--accent)" stroke-width="2" opacity="0.7"/>`;
+  // Dots
+  pts.forEach(p => {
+    html += `<circle cx="${p.x}" cy="${p.y}" r="3" fill="${p.improved?'#22c55e':'#ef4444'}" opacity="0.8"/>`;
+  });
+  // Axes
+  html += `<line x1="${pad}" y1="${pad}" x2="${pad}" y2="${h-pad}" stroke="var(--border)" stroke-width="1"/>`;
+  html += `<line x1="${pad}" y1="${h-pad}" x2="${w-pad}" y2="${h-pad}" stroke="var(--border)" stroke-width="1"/>`;
+  // Labels
+  for (let s = 0; s <= 10; s += 2) {
+    const y = h - pad - (s / 10) * (h - pad * 2);
+    html += `<text x="${pad-5}" y="${y+4}" text-anchor="end" fill="var(--text2)" font-size="10">${s}</text>`;
+  }
+  svg.innerHTML = html;
+}
+
+// Create experiment
+function showCreate() { document.getElementById('create-form').style.display = ''; renderModelChips(); addEvalRow(); }
+function hideCreate() { document.getElementById('create-form').style.display = 'none'; }
+
+let selectedModels = new Set();
+function renderModelChips() {
+  document.getElementById('cr-models').innerHTML = allModels.map(m => {
+    const s = selectedModels.has(m.name);
+    return `<span class="model-chip ${s?'sel':''}" onclick="toggleChip('${m.name}')">${m.display_name || m.name}</span>`;
+  }).join('');
+}
+function toggleChip(name) { selectedModels.has(name) ? selectedModels.delete(name) : selectedModels.add(name); renderModelChips(); }
+
+let evalRows = [];
+function addEvalRow() {
+  evalRows.push({input:'', expected:''});
+  renderEvalRows();
+}
+function renderEvalRows() {
+  document.getElementById('cr-evals').innerHTML = evalRows.map((r, i) =>
+    `<div class="eval-row">
+      <textarea placeholder="Input prompt..." oninput="evalRows[${i}].input=this.value">${r.input}</textarea>
+      <textarea placeholder="Expected output (optional)..." oninput="evalRows[${i}].expected=this.value">${r.expected}</textarea>
+      <button class="btn btn-r" onclick="evalRows.splice(${i},1);renderEvalRows()">x</button>
+    </div>`
+  ).join('');
+}
+
+async function createExp() {
+  const name = document.getElementById('cr-name').value.trim();
+  if (!name) return toast('Name required', false);
+  if (!selectedModels.size) return toast('Select at least one model', false);
+  if (!evalRows.filter(r=>r.input).length) return toast('Add at least one eval case', false);
+  const models = [...selectedModels];
+  const body = {
+    name,
+    objective: document.getElementById('cr-obj').value,
+    metric: document.getElementById('cr-metric').value,
+    models_pool: models,
+    eval_cases: evalRows.filter(r => r.input),
+    mutable_config: { system_prompt: 'You are a helpful assistant.', temperature: 0.7, model: models[0] }
+  };
+  await fetch('/api/lab/experiments', {method:'POST', headers:{'Content-Type':'application/json'}, body:JSON.stringify(body)});
+  hideCreate();
+  evalRows = [];
+  selectedModels.clear();
+  document.getElementById('cr-name').value = '';
+  document.getElementById('cr-obj').value = '';
+  await loadExperiments();
+  toast('Experiment created');
+}
+
+// Results tab
+function renderResults() {
+  const el = document.getElementById('results-list');
+  if (!experiments.length) { el.innerHTML = '<div class="empty">No experiments yet.</div>'; return; }
+  el.innerHTML = experiments.map(e => {
+    const rate = e.total_trials > 0 ? ((e.improvements / e.total_trials) * 100).toFixed(0) : 0;
+    return `<div class="exp-item" onclick="viewResult(${e.id})">
+      <div class="name">${e.name} <span class="status-pill ${e.status}">${e.status}</span></div>
+      <div class="meta"><span>Trials: ${e.total_trials}</span><span>Best: ${(e.best_score||0).toFixed(1)}/10</span><span>Hit rate: ${rate}%</span></div>
+    </div>`;
+  }).join('');
+}
+
+async function viewResult(id) {
+  const r = await fetch('/api/lab/experiments/' + id);
+  const exp = await r.json();
+  document.getElementById('result-detail').style.display = '';
+  document.getElementById('res-name').textContent = exp.name;
+  const trials = (exp.trials || []).map(t => ({trial: t.trial_num, score: t.avg_score, improved: t.improved, best: exp.best_score, diff: t.config_diff}));
+  renderChart('res-chart', trials);
+  document.getElementById('res-trials').innerHTML = trials.slice(-50).reverse().map(t =>
+    `<div class="trial-item">
+      <div class="ind" style="background:${t.improved?'var(--green)':'var(--red)'}"></div>
+      <div class="num">#${t.trial}</div>
+      <div class="diff">${t.diff || ''}</div>
+      <div class="score" style="color:${t.improved?'var(--green)':'var(--text2)'}">${(t.score||0).toFixed(1)}</div>
+    </div>`
+  ).join('');
+  activeExp = exp;
+}
+
+function exportBest() {
+  if (!activeExp || !activeExp.best_config) return toast('No best config', false);
+  const blob = new Blob([JSON.stringify(activeExp.best_config, null, 2)], {type:'application/json'});
+  const a = document.createElement('a');
+  a.href = URL.createObjectURL(blob);
+  a.download = (activeExp.name||'config').replace(/\s+/g,'_') + '_best.json';
+  a.click();
+}
+
+function labTab(name) {
+  document.querySelectorAll('.tab').forEach(t => t.classList.toggle('active', t.textContent.toLowerCase().includes(name.substring(0,4))));
+  document.querySelectorAll('.tc').forEach(c => c.classList.toggle('active', c.id === 'lt-'+name));
+  if (name === 'results') loadExperiments();
+}
+
+function toast(msg, ok=true) {
+  const t = document.createElement('div');
+  t.className = 'toast ' + (ok ? 'ok' : 'err');
+  t.textContent = msg;
+  document.body.appendChild(t);
+  setTimeout(() => t.remove(), 3000);
+}
+
+init();
+</script>
+</body>
+</html>
+"""
+
+
+# ─── HELPERS ───────────────────────────────────────────────────
+
+def _get_timeout(model_id):
+    cfg = load_config()
+    t = cfg["timeouts"]["per_model"].get(model_id)
+    if t:
+        return t
+    if "::" in model_id:
+        prov = model_id.split("::")[0]
+        return cfg["providers"].get(prov, {}).get("timeout", cfg["timeouts"]["global"])
+    return cfg["providers"].get("ollama", {}).get("timeout", cfg["timeouts"]["global"])
+
+
+def query_ollama(model, prompt, timeout):
+    cfg = load_config()
+    base = cfg["providers"]["ollama"].get("base_url", "http://localhost:11434")
+    resp = requests.post(f"{base}/api/generate", json={
+        "model": model, "prompt": prompt, "stream": False,
+    }, timeout=timeout)
+    resp.raise_for_status()
+    return resp.json()["response"]
+
+
+def query_openai_compatible(model, prompt, provider_name, timeout):
+    cfg = load_config()
+    prov = cfg["providers"].get(provider_name, {})
+    base = prov.get("base_url", "https://openrouter.ai/api/v1")
+    api_key = get_api_key(provider_name)
+    headers = {"Authorization": f"Bearer {api_key}", "Content-Type": "application/json"}
+    if provider_name == "openrouter":
+        headers["HTTP-Referer"] = "http://localhost:5000"
+        headers["X-Title"] = "LLM Team UI"
+    resp = requests.post(f"{base}/chat/completions", headers=headers, json={
+        "model": model, "messages": [{"role": "user", "content": prompt}], "stream": False,
+    }, timeout=timeout)
+    resp.raise_for_status()
+    return resp.json()["choices"][0]["message"]["content"]
+
+
+def query_anthropic(model, prompt, timeout):
+    cfg = load_config()
+    prov = cfg["providers"].get("anthropic", {})
+    base = prov.get("base_url", "https://api.anthropic.com/v1")
+    api_key = get_api_key("anthropic")
+    resp = requests.post(f"{base}/messages", headers={
+        "x-api-key": api_key, "anthropic-version": "2023-06-01", "Content-Type": "application/json",
+    }, json={
+        "model": model, "max_tokens": 4096,
+        "messages": [{"role": "user", "content": prompt}],
+    }, timeout=timeout)
+    resp.raise_for_status()
+    return resp.json()["content"][0]["text"]
+
+
+def query_model(model_id, prompt):
+    timeout = _get_timeout(model_id)
+    if "::" in model_id:
+        provider_name, model_name = model_id.split("::", 1)
+        if provider_name == "anthropic":
+            return query_anthropic(model_name, prompt, timeout)
+        return query_openai_compatible(model_name, prompt, provider_name, timeout)
+    return query_ollama(model_id, prompt, timeout)
+
+
+# ─── CONTEXT MANAGEMENT ───────────────────────────────────────
+
+# Context window sizes (tokens) — conservative estimates for safe prompting
+MODEL_CONTEXT = {
+    "llama3.2": 4096, "mistral": 8192, "gemma2": 8192, "qwen2.5": 8192,
+    "gpt-oss": 4096, "gpt-4o": 128000, "gpt-4o-mini": 128000,
+    "claude-3": 200000, "claude-sonnet": 200000, "claude-haiku": 200000,
+}
+DEFAULT_CONTEXT = 4096  # safe fallback for unknown models
+MAX_RESPONSE_CHARS = 12000  # cap individual responses (~3K tokens)
+
+
+def estimate_tokens(text):
+    """Rough token estimate: ~4 chars per token for English."""
+    return len(text) // 4 + 1
+
+
+def get_context_limit(model_id):
+    """Get context window size for a model."""
+    name = model_id.split("::")[-1].split(":")[0].lower()
+    for key, limit in MODEL_CONTEXT.items():
+        if key in name:
+            return limit
+    # OpenRouter models generally have larger contexts
+    if "::" in model_id:
+        return 16000
+    return DEFAULT_CONTEXT
+
+
+def smart_truncate(text, max_tokens, preserve_end=200):
+    """Truncate text preserving start and end, with a clear marker."""
+    if estimate_tokens(text) <= max_tokens:
+        return text
+    max_chars = max_tokens * 4
+    end_chars = preserve_end * 4
+    if max_chars <= end_chars * 2:
+        return text[:max_chars]
+    start = text[:max_chars - end_chars - 60]
+    end = text[-end_chars:]
+    return f"{start}\n\n[... truncated {estimate_tokens(text) - max_tokens} tokens ...]\n\n{end}"
+
+
+def cap_response(text):
+    """Cap a single model response to prevent runaway output."""
+    if len(text) <= MAX_RESPONSE_CHARS:
+        return text
+    return smart_truncate(text, MAX_RESPONSE_CHARS // 4)
+
+
+def build_context(parts, model_id, reserve_for_response=1024):
+    """Build a prompt from parts, fitting within model's context window.
+
+    parts: list of (label, text, priority) tuples
+           priority: 1=must keep, 2=important, 3=can truncate heavily
+    Returns: assembled prompt string that fits in context.
+    """
+    limit = get_context_limit(model_id)
+    budget = limit - reserve_for_response
+    if budget <= 0:
+        budget = limit // 2
+
+    # First pass: measure everything
+    total = sum(estimate_tokens(t) for _, t, _ in parts)
+    if total <= budget:
+        return "\n\n".join(f"{label}\n{text}" if label else text for label, text, _ in parts)
+
+    # Need to truncate — allocate budget by priority
+    p1 = [(l, t, p) for l, t, p in parts if p == 1]
+    p2 = [(l, t, p) for l, t, p in parts if p == 2]
+    p3 = [(l, t, p) for l, t, p in parts if p == 3]
+
+    p1_tokens = sum(estimate_tokens(t) for _, t, _ in p1)
+    remaining = budget - p1_tokens
+
+    if remaining <= 0:
+        # Even priority 1 doesn't fit — truncate p1
+        per_part = budget // max(len(p1), 1)
+        result = []
+        for label, text, _ in p1:
+            result.append(f"{label}\n{smart_truncate(text, per_part)}" if label else smart_truncate(text, per_part))
+        return "\n\n".join(result)
+
+    # Allocate remaining to p2, then p3
+    result = [f"{l}\n{t}" if l else t for l, t, _ in p1]
+
+    for group in [p2, p3]:
+        if not group or remaining <= 0:
+            continue
+        per_part = remaining // max(len(group), 1)
+        for label, text, _ in group:
+            truncated = smart_truncate(text, max(per_part, 100))
+            result.append(f"{label}\n{truncated}" if label else truncated)
+            remaining -= estimate_tokens(truncated)
+
+    return "\n\n".join(result)
+
+
+def safe_query(model_id, prompt, fallback_summarize=True):
+    """Query with context safety — auto-truncates prompt if too large, retries on overflow errors."""
+    limit = get_context_limit(model_id)
+    prompt_tokens = estimate_tokens(prompt)
+
+    # Pre-flight check: truncate if obviously too large
+    if prompt_tokens > limit - 500:
+        prompt = smart_truncate(prompt, limit - 1000)
+
+    try:
+        response = query_model(model_id, prompt)
+        return cap_response(response)
+    except Exception as e:
+        err = str(e).lower()
+        # Detect context overflow errors from various providers
+        if any(k in err for k in ["context length", "too many tokens", "maximum context", "token limit",
+                                    "content_too_large", "request too large", "413", "400"]):
+            if fallback_summarize:
+                # Aggressive truncation and retry
+                truncated = smart_truncate(prompt, limit // 2)
+                try:
+                    response = query_model(model_id, truncated)
+                    return cap_response(response)
+                except Exception:
+                    pass
+            return f"[Context overflow: prompt was ~{prompt_tokens} tokens, model limit ~{limit}. Response truncated to fit.]"
+        raise
+
+
+def parallel_safe_query(models, prompt):
+    """Like parallel_query but with context safety on each model."""
+    results = {}
+    max_timeout = max((_get_timeout(m) for m in models), default=300) + 30
+    with ThreadPoolExecutor(max_workers=max(len(models), 1)) as pool:
+        futures = {pool.submit(safe_query, m, prompt): m for m in models}
+        for future in as_completed(futures, timeout=max_timeout):
+            model = futures[future]
+            try:
+                results[model] = future.result(timeout=10)
+            except Exception as e:
+                results[model] = f"Error: {e}"
+    return results
+
+
+def sse(data):
+    return f"data: {json.dumps(data)}\n\n"
+
+
+def parallel_query(models, prompt):
+    """Query multiple models in parallel with context safety."""
+    return parallel_safe_query(models, prompt)
+
+
+# ─── ROUTES ────────────────────────────────────────────────────
+
+@app.route("/")
+def index():
+    return render_template_string(HTML)
+
+
+@app.route("/api/models")
+def get_models():
+    SKIP = {"nomic-embed-text", "mxbai-embed-large", "all-minilm", "snowflake-arctic-embed"}
+    cfg = load_config()
+    models = []
+    # Local Ollama models
+    if cfg["providers"]["ollama"].get("enabled", True):
+        try:
+            base = cfg["providers"]["ollama"].get("base_url", "http://localhost:11434")
+            resp = requests.get(f"{base}/api/tags", timeout=10)
+            seen = set()
+            for m in resp.json().get("models", []):
+                full = m["name"]
+                short = full.split(":")[0]
+                size = m.get("size", 0)
+                if short in SKIP or size < 1_000_000 or short in seen:
+                    continue
+                if full in cfg.get("disabled_models", []):
+                    continue
+                seen.add(short)
+                models.append({"name": full, "size": f"{size/(1024**3):.1f} GB",
+                               "provider": "ollama", "provider_label": "Local",
+                               "display_name": short})
+        except Exception:
+            pass
+    # Cloud models
+    for cm in cfg.get("cloud_models", []):
+        if not cm.get("enabled", True):
+            continue
+        prov = cm["id"].split("::")[0] if "::" in cm["id"] else "cloud"
+        if not cfg["providers"].get(prov, {}).get("enabled", False):
+            continue
+        models.append({"name": cm["id"], "size": cm.get("context", "cloud"),
+                       "provider": prov, "provider_label": prov.title(),
+                       "display_name": cm.get("display_name", cm["id"].split("::")[-1])})
+    return jsonify({"models": models})
+
+
+# ─── ADMIN ROUTES ─────────────────────────────────────────────
+
+@app.route("/admin")
+def admin_page():
+    return render_template_string(ADMIN_HTML)
+
+
+@app.route("/api/admin/config", methods=["GET"])
+def admin_get_config():
+    cfg = load_config()
+    safe = json.loads(json.dumps(cfg))
+    for name, p in safe["providers"].items():
+        if p.get("api_key"):
+            p["api_key_set"] = True
+            p["api_key"] = ""
+        else:
+            p["api_key_set"] = bool(get_api_key(name))
+    return jsonify(safe)
+
+
+@app.route("/api/admin/config", methods=["POST"])
+def admin_save_config():
+    data = request.json
+    cfg = load_config()
+    # update providers (preserve existing keys if not sent)
+    for name, prov in data.get("providers", {}).items():
+        if name in cfg["providers"]:
+            new_key = prov.get("api_key", "")
+            if not new_key:
+                prov["api_key"] = cfg["providers"][name].get("api_key", "")
+            cfg["providers"][name].update(prov)
+    if "disabled_models" in data:
+        cfg["disabled_models"] = data["disabled_models"]
+    if "cloud_models" in data:
+        cfg["cloud_models"] = data["cloud_models"]
+    if "timeouts" in data:
+        cfg["timeouts"] = data["timeouts"]
+    save_config(cfg)
+    return jsonify({"ok": True})
+
+
+@app.route("/api/admin/test-provider", methods=["POST"])
+def admin_test_provider():
+    data = request.json
+    name = data.get("provider", "")
+    cfg = load_config()
+    prov = cfg["providers"].get(name, {})
+    try:
+        if name == "ollama":
+            r = requests.get(f"{prov.get('base_url', 'http://localhost:11434')}/api/tags", timeout=5)
+            count = len(r.json().get("models", []))
+            return jsonify({"ok": True, "message": f"Connected. {count} models available."})
+        elif name == "openrouter":
+            key = data.get("api_key") or get_api_key("openrouter")
+            r = requests.get(f"{prov.get('base_url', 'https://openrouter.ai/api/v1')}/models",
+                             headers={"Authorization": f"Bearer {key}"}, timeout=10)
+            count = len(r.json().get("data", []))
+            return jsonify({"ok": True, "message": f"Connected. {count} models available."})
+        elif name == "openai":
+            key = data.get("api_key") or get_api_key("openai")
+            r = requests.get(f"{prov.get('base_url', 'https://api.openai.com/v1')}/models",
+                             headers={"Authorization": f"Bearer {key}"}, timeout=10)
+            return jsonify({"ok": True, "message": f"Connected. {len(r.json().get('data', []))} models."})
+        elif name == "anthropic":
+            key = data.get("api_key") or get_api_key("anthropic")
+            r = requests.post(f"{prov.get('base_url', 'https://api.anthropic.com/v1')}/messages",
+                              headers={"x-api-key": key, "anthropic-version": "2023-06-01", "Content-Type": "application/json"},
+                              json={"model": "claude-haiku-4-5-20251001", "max_tokens": 1, "messages": [{"role": "user", "content": "hi"}]},
+                              timeout=10)
+            return jsonify({"ok": True, "message": "Connected to Anthropic."})
+        return jsonify({"ok": False, "message": "Unknown provider"})
+    except Exception as e:
+        return jsonify({"ok": False, "message": str(e)})
+
+
+_or_models_cache = {"data": None, "ts": 0}
+
+@app.route("/api/admin/openrouter/models")
+def admin_openrouter_models():
+    import time
+    now = time.time()
+    if _or_models_cache["data"] and now - _or_models_cache["ts"] < 300:
+        return jsonify({"models": _or_models_cache["data"]})
+    key = get_api_key("openrouter")
+    headers = {"Authorization": f"Bearer {key}"} if key else {}
+    try:
+        r = requests.get("https://openrouter.ai/api/v1/models", headers=headers, timeout=15)
+        r.raise_for_status()
+        free = []
+        for m in r.json().get("data", []):
+            pricing = m.get("pricing", {})
+            if pricing.get("prompt") == "0" and pricing.get("completion") == "0":
+                free.append({"id": m["id"], "name": m.get("name", m["id"]),
+                             "context_length": m.get("context_length", 0)})
+        _or_models_cache["data"] = free
+        _or_models_cache["ts"] = now
+        return jsonify({"models": free})
+    except Exception as e:
+        return jsonify({"models": [], "error": str(e)})
+
+
+@app.route("/api/admin/ollama-models")
+def admin_ollama_models():
+    cfg = load_config()
+    base = cfg["providers"]["ollama"].get("base_url", "http://localhost:11434")
+    SKIP = {"nomic-embed-text", "mxbai-embed-large", "all-minilm", "snowflake-arctic-embed"}
+    try:
+        resp = requests.get(f"{base}/api/tags", timeout=10)
+        models = []
+        seen = set()
+        for m in resp.json().get("models", []):
+            full = m["name"]
+            short = full.split(":")[0]
+            size = m.get("size", 0)
+            if short in SKIP or size < 1_000_000 or short in seen:
+                continue
+            seen.add(short)
+            models.append({"name": full, "size": f"{size/(1024**3):.1f} GB",
+                           "disabled": full in cfg.get("disabled_models", [])})
+        return jsonify({"models": models})
+    except Exception as e:
+        return jsonify({"models": [], "error": str(e)})
+
+
+# ─── HISTORY ROUTES ────────────────────────────────────────────
+
+@app.route("/api/runs")
+def get_runs():
+    try:
+        with get_db() as conn:
+            with conn.cursor(cursor_factory=psycopg2.extras.RealDictCursor) as cur:
+                cur.execute("SELECT id, mode, prompt, models_used, created_at FROM team_runs ORDER BY created_at DESC LIMIT 50")
+                runs = cur.fetchall()
+                for r in runs:
+                    r["created_at"] = r["created_at"].isoformat()
+        return jsonify({"runs": runs})
+    except Exception as e:
+        return jsonify({"runs": [], "error": str(e)})
+
+
+@app.route("/api/runs/<int:run_id>")
+def get_run(run_id):
+    try:
+        with get_db() as conn:
+            with conn.cursor(cursor_factory=psycopg2.extras.RealDictCursor) as cur:
+                cur.execute("SELECT * FROM team_runs WHERE id = %s", (run_id,))
+                run = cur.fetchone()
+                if not run:
+                    return jsonify({"error": "not found"}), 404
+                run["created_at"] = run["created_at"].isoformat()
+        return jsonify(run)
+    except Exception as e:
+        return jsonify({"error": str(e)}), 500
+
+
+@app.route("/api/runs/<int:run_id>", methods=["DELETE"])
+def delete_run(run_id):
+    try:
+        with get_db() as conn:
+            with conn.cursor() as cur:
+                cur.execute("DELETE FROM team_runs WHERE id = %s", (run_id,))
+            conn.commit()
+        return jsonify({"ok": True})
+    except Exception as e:
+        return jsonify({"error": str(e)}), 500
+
+
+@app.route("/api/pipelines")
+def get_pipelines():
+    try:
+        with get_db() as conn:
+            with conn.cursor(cursor_factory=psycopg2.extras.RealDictCursor) as cur:
+                cur.execute("SELECT id, pipeline, topic, status, models_used, duration_ms, created_at FROM pipeline_runs ORDER BY created_at DESC LIMIT 50")
+                runs = cur.fetchall()
+                for r in runs:
+                    r["created_at"] = r["created_at"].isoformat() if r["created_at"] else None
+        return jsonify({"pipelines": runs})
+    except Exception as e:
+        return jsonify({"pipelines": [], "error": str(e)})
+
+
+@app.route("/api/pipelines/<int:pid>")
+def get_pipeline(pid):
+    try:
+        with get_db() as conn:
+            with conn.cursor(cursor_factory=psycopg2.extras.RealDictCursor) as cur:
+                cur.execute("SELECT * FROM pipeline_runs WHERE id = %s", (pid,))
+                run = cur.fetchone()
+                if not run:
+                    return jsonify({"error": "not found"}), 404
+                run["created_at"] = run["created_at"].isoformat() if run["created_at"] else None
+                run["completed_at"] = run["completed_at"].isoformat() if run["completed_at"] else None
+        return jsonify(run)
+    except Exception as e:
+        return jsonify({"error": str(e)}), 500
+
+
+# ─── LAB: RATCHET ENGINE ──────────────────────────────────────
+
+_lab_threads = {}  # experiment_id -> thread
+_lab_streams = {}  # experiment_id -> [queue, ...]
+
+def _lab_emit(exp_id, data):
+    for q in _lab_streams.get(exp_id, []):
+        q.append(data)
+
+
+def _score_response(response, expected, metric, judge_model=None):
+    if metric == "accuracy":
+        if not expected:
+            return 5.0
+        resp_lower = response.lower().strip()
+        exp_lower = expected.lower().strip()
+        if exp_lower in resp_lower:
+            return 10.0
+        if any(w in resp_lower for w in exp_lower.split()):
+            return 5.0
+        return 1.0
+    elif metric == "speed":
+        return 10.0  # speed scored externally by duration
+    elif metric == "quality" and judge_model:
+        try:
+            judgment = query_model(judge_model,
+                f"Rate this response 1-10 for quality, relevance, and completeness.\n\n"
+                f"EXPECTED: {expected or 'No expected output specified'}\n\n"
+                f"RESPONSE: {response[:1500]}\n\n"
+                f"Return ONLY a number 1-10, nothing else.")
+            import re
+            m = re.search(r'\b(\d+)\b', judgment)
+            return min(float(m.group(1)), 10.0) if m else 5.0
+        except Exception:
+            return 5.0
+    return 5.0
+
+
+def _ratchet_loop(exp_id):
+    try:
+        with get_db() as conn:
+            with conn.cursor(cursor_factory=psycopg2.extras.RealDictCursor) as cur:
+                cur.execute("SELECT * FROM lab_experiments WHERE id = %s", (exp_id,))
+                exp = cur.fetchone()
+        if not exp:
+            return
+
+        eval_cases = exp["eval_cases"] or []
+        models_pool = exp["models_pool"] or []
+        metric = exp["metric"] or "quality"
+        objective = exp["objective"] or "Improve response quality"
+        mutable = exp["mutable_config"] or {
+            "system_prompt": "You are a helpful assistant.",
+            "temperature": 0.7,
+            "model": models_pool[0] if models_pool else "llama3.2:latest",
+        }
+        best_config = exp["best_config"] or json.loads(json.dumps(mutable))
+        best_score = exp["best_score"] or 0
+        trial_num = exp["total_trials"] or 0
+
+        # Pick meta-model (largest in pool)
+        meta_model = models_pool[-1] if models_pool else "qwen2.5:latest"
+        judge_model = models_pool[0] if models_pool else "llama3.2:latest"
+
+        while True:
+            # Check if still running
+            with get_db() as conn:
+                with conn.cursor() as cur:
+                    cur.execute("SELECT status FROM lab_experiments WHERE id = %s", (exp_id,))
+                    row = cur.fetchone()
+                    if not row or row[0] != "running":
+                        break
+
+            trial_num += 1
+            trial_start = time.time()
+            _lab_emit(exp_id, {"type": "status", "trial": trial_num, "message": "Proposing change..."})
+
+            # Step 1: Meta-model proposes a change
+            history_hint = ""
+            if trial_num > 1:
+                with get_db() as conn:
+                    with conn.cursor(cursor_factory=psycopg2.extras.RealDictCursor) as cur:
+                        cur.execute("SELECT config_diff, avg_score, improved FROM lab_trials WHERE experiment_id = %s ORDER BY id DESC LIMIT 5", (exp_id,))
+                        recent = cur.fetchall()
+                        if recent:
+                            history_hint = "\n\nRecent trials:\n" + "\n".join(
+                                f"  {'KEPT' if r['improved'] else 'DISCARDED'} (score {r['avg_score']:.1f}): {r['config_diff']}" for r in recent)
+
+            propose_prompt = (
+                f"You are optimizing an LLM pipeline. Objective: {objective}\n"
+                f"Metric: {metric} (higher is better, max 10)\n"
+                f"Current best score: {best_score:.1f}/10\n\n"
+                f"Current config:\n{json.dumps(mutable, indent=2)}\n\n"
+                f"Available models: {models_pool}\n"
+                f"Eval cases: {len(eval_cases)}\n"
+                f"{history_hint}\n\n"
+                f"Suggest exactly ONE change to improve the score. Return ONLY valid JSON with the FULL updated config. "
+                f"Keys: system_prompt (string), temperature (0.0-1.5), model (string from available models). "
+                f"Be creative but focused. Change only one thing at a time."
+            )
+            try:
+                proposal_raw = query_model(meta_model, propose_prompt)
+                import re
+                json_match = re.search(r'\{[\s\S]*\}', proposal_raw)
+                if json_match:
+                    proposed = json.loads(json_match.group())
+                    # Validate keys
+                    if "system_prompt" not in proposed:
+                        proposed["system_prompt"] = mutable.get("system_prompt", "")
+                    if "temperature" not in proposed:
+                        proposed["temperature"] = mutable.get("temperature", 0.7)
+                    if "model" not in proposed:
+                        proposed["model"] = mutable.get("model", models_pool[0])
+                else:
+                    proposed = mutable
+            except Exception:
+                proposed = mutable
+
+            # Describe the diff
+            diffs = []
+            for k in set(list(mutable.keys()) + list(proposed.keys())):
+                old_v = mutable.get(k)
+                new_v = proposed.get(k)
+                if old_v != new_v:
+                    if k == "system_prompt":
+                        diffs.append(f"system_prompt changed ({len(str(old_v))} → {len(str(new_v))} chars)")
+                    else:
+                        diffs.append(f"{k}: {old_v} → {new_v}")
+            config_diff = "; ".join(diffs) if diffs else "no change"
+            _lab_emit(exp_id, {"type": "status", "trial": trial_num, "message": f"Testing: {config_diff[:80]}"})
+
+            # Step 2: Run eval cases with proposed config
+            trial_scores = []
+            model_to_use = proposed.get("model", models_pool[0] if models_pool else "llama3.2:latest")
+            sys_prompt = proposed.get("system_prompt", "")
+
+            for ci, case in enumerate(eval_cases):
+                inp = case.get("input", "")
+                expected = case.get("expected", "")
+                full_prompt = f"{sys_prompt}\n\n{inp}" if sys_prompt else inp
+                try:
+                    resp = query_model(model_to_use, full_prompt)
+                    score = _score_response(resp, expected, metric, judge_model if metric == "quality" else None)
+                    trial_scores.append({"input": inp[:100], "score": score, "response": resp[:300]})
+                except Exception as e:
+                    trial_scores.append({"input": inp[:100], "score": 0, "error": str(e)})
+
+            avg_score = sum(s["score"] for s in trial_scores) / max(len(trial_scores), 1)
+            duration_ms = int((time.time() - trial_start) * 1000)
+            improved = avg_score > best_score
+
+            # Step 3: Ratchet
+            if improved:
+                best_score = avg_score
+                best_config = json.loads(json.dumps(proposed))
+                mutable = json.loads(json.dumps(proposed))
+            else:
+                mutable = json.loads(json.dumps(best_config))
+
+            # Save trial
+            with get_db() as conn:
+                with conn.cursor() as cur:
+                    cur.execute(
+                        """INSERT INTO lab_trials (experiment_id, trial_num, config_diff, config_snapshot, scores, avg_score, improved, duration_ms)
+                           VALUES (%s, %s, %s, %s, %s, %s, %s, %s)""",
+                        (exp_id, trial_num, config_diff, json.dumps(proposed), json.dumps(trial_scores), avg_score, improved, duration_ms)
+                    )
+                    cur.execute(
+                        """UPDATE lab_experiments SET total_trials = %s, best_score = %s, best_config = %s, mutable_config = %s,
+                           improvements = improvements + %s WHERE id = %s""",
+                        (trial_num, best_score, json.dumps(best_config), json.dumps(mutable), 1 if improved else 0, exp_id)
+                    )
+                conn.commit()
+
+            _lab_emit(exp_id, {
+                "type": "trial", "trial": trial_num, "score": round(avg_score, 2),
+                "best": round(best_score, 2), "improved": improved, "diff": config_diff[:100],
+                "duration_ms": duration_ms
+            })
+
+        # Done
+        with get_db() as conn:
+            with conn.cursor() as cur:
+                cur.execute("UPDATE lab_experiments SET status = 'paused' WHERE id = %s AND status = 'running'", (exp_id,))
+            conn.commit()
+        _lab_emit(exp_id, {"type": "done"})
+
+    except Exception as e:
+        _lab_emit(exp_id, {"type": "error", "message": str(e)})
+        try:
+            with get_db() as conn:
+                with conn.cursor() as cur:
+                    cur.execute("UPDATE lab_experiments SET status = 'error' WHERE id = %s", (exp_id,))
+                conn.commit()
+        except Exception:
+            pass
+
+
+# ─── LAB API ROUTES ───────────────────────────────────────────
+
+@app.route("/lab")
+def lab_page():
+    return render_template_string(LAB_HTML)
+
+
+@app.route("/api/lab/experiments", methods=["GET"])
+def lab_list():
+    with get_db() as conn:
+        with conn.cursor(cursor_factory=psycopg2.extras.RealDictCursor) as cur:
+            cur.execute("SELECT id, name, status, metric, best_score, total_trials, improvements, models_pool, created_at FROM lab_experiments ORDER BY created_at DESC")
+            rows = cur.fetchall()
+            for r in rows:
+                r["created_at"] = r["created_at"].isoformat()
+    return jsonify({"experiments": rows})
+
+
+@app.route("/api/lab/experiments", methods=["POST"])
+def lab_create():
+    d = request.json
+    with get_db() as conn:
+        with conn.cursor() as cur:
+            cur.execute(
+                """INSERT INTO lab_experiments (name, objective, metric, eval_cases, mutable_config, best_config, models_pool)
+                   VALUES (%s, %s, %s, %s, %s, %s, %s) RETURNING id""",
+                (d["name"], d.get("objective", ""), d.get("metric", "quality"),
+                 json.dumps(d.get("eval_cases", [])),
+                 json.dumps(d.get("mutable_config", {"system_prompt": "You are a helpful assistant.", "temperature": 0.7, "model": ""})),
+                 json.dumps(d.get("mutable_config", {"system_prompt": "You are a helpful assistant.", "temperature": 0.7, "model": ""})),
+                 d.get("models_pool", []))
+            )
+            eid = cur.fetchone()[0]
+        conn.commit()
+    return jsonify({"id": eid})
+
+
+@app.route("/api/lab/experiments/<int:eid>", methods=["GET"])
+def lab_get(eid):
+    with get_db() as conn:
+        with conn.cursor(cursor_factory=psycopg2.extras.RealDictCursor) as cur:
+            cur.execute("SELECT * FROM lab_experiments WHERE id = %s", (eid,))
+            exp = cur.fetchone()
+            if not exp:
+                return jsonify({"error": "not found"}), 404
+            exp["created_at"] = exp["created_at"].isoformat()
+            cur.execute("SELECT * FROM lab_trials WHERE experiment_id = %s ORDER BY trial_num", (eid,))
+            exp["trials"] = cur.fetchall()
+            for t in exp["trials"]:
+                t["created_at"] = t["created_at"].isoformat()
+    return jsonify(exp)
+
+
+@app.route("/api/lab/experiments/<int:eid>", methods=["PUT"])
+def lab_update(eid):
+    d = request.json
+    sets, vals = [], []
+    for k in ["name", "objective", "metric"]:
+        if k in d:
+            sets.append(f"{k} = %s")
+            vals.append(d[k])
+    for k in ["eval_cases", "mutable_config"]:
+        if k in d:
+            sets.append(f"{k} = %s")
+            vals.append(json.dumps(d[k]))
+    if "models_pool" in d:
+        sets.append("models_pool = %s")
+        vals.append(d["models_pool"])
+    if not sets:
+        return jsonify({"ok": True})
+    vals.append(eid)
+    with get_db() as conn:
+        with conn.cursor() as cur:
+            cur.execute(f"UPDATE lab_experiments SET {', '.join(sets)} WHERE id = %s", vals)
+        conn.commit()
+    return jsonify({"ok": True})
+
+
+@app.route("/api/lab/experiments/<int:eid>/start", methods=["POST"])
+def lab_start(eid):
+    with get_db() as conn:
+        with conn.cursor() as cur:
+            cur.execute("UPDATE lab_experiments SET status = 'running' WHERE id = %s", (eid,))
+        conn.commit()
+    if eid in _lab_threads and _lab_threads[eid].is_alive():
+        return jsonify({"ok": True, "message": "Already running"})
+    t = threading.Thread(target=_ratchet_loop, args=(eid,), daemon=True)
+    _lab_threads[eid] = t
+    t.start()
+    return jsonify({"ok": True})
+
+
+@app.route("/api/lab/experiments/<int:eid>/pause", methods=["POST"])
+def lab_pause(eid):
+    with get_db() as conn:
+        with conn.cursor() as cur:
+            cur.execute("UPDATE lab_experiments SET status = 'paused' WHERE id = %s", (eid,))
+        conn.commit()
+    return jsonify({"ok": True})
+
+
+@app.route("/api/lab/experiments/<int:eid>/reset", methods=["POST"])
+def lab_reset(eid):
+    with get_db() as conn:
+        with conn.cursor() as cur:
+            cur.execute("UPDATE lab_experiments SET status = 'idle', total_trials = 0, improvements = 0, best_score = 0, best_config = mutable_config WHERE id = %s", (eid,))
+            cur.execute("DELETE FROM lab_trials WHERE experiment_id = %s", (eid,))
+        conn.commit()
+    return jsonify({"ok": True})
+
+
+@app.route("/api/lab/experiments/<int:eid>/delete", methods=["DELETE"])
+def lab_delete(eid):
+    with get_db() as conn:
+        with conn.cursor() as cur:
+            cur.execute("DELETE FROM lab_experiments WHERE id = %s", (eid,))
+        conn.commit()
+    return jsonify({"ok": True})
+
+
+@app.route("/api/lab/experiments/<int:eid>/stream")
+def lab_stream(eid):
+    q = []
+    _lab_streams.setdefault(eid, []).append(q)
+    def generate():
+        try:
+            while True:
+                if q:
+                    data = q.pop(0)
+                    yield f"data: {json.dumps(data)}\n\n"
+                    if data.get("type") == "done":
+                        break
+                else:
+                    time.sleep(0.5)
+                    yield ": keepalive\n\n"
+        finally:
+            _lab_streams.get(eid, []).remove(q) if q in _lab_streams.get(eid, []) else None
+    return Response(generate(), mimetype="text/event-stream",
+                    headers={"Cache-Control": "no-cache", "X-Accel-Buffering": "no"})
+
+
+# ─── TEAM ROUTES ──────────────────────────────────────────────
+
+@app.route("/api/run", methods=["POST"])
+def run_team():
+    config = request.json
+    mode = config["mode"]
+
+    RUNNERS = {
+        "brainstorm": run_brainstorm, "pipeline": run_pipeline, "debate": run_debate,
+        "validator": run_validator, "roundrobin": run_roundrobin, "redteam": run_redteam,
+        "consensus": run_consensus, "codereview": run_codereview, "ladder": run_ladder,
+        "tournament": run_tournament, "evolution": run_evolution, "blindassembly": run_blindassembly,
+        "staircase": run_staircase, "drift": run_drift, "mesh": run_mesh,
+        "hallucination": run_hallucination, "timeloop": run_timeloop,
+        "research": run_research, "eval": run_eval, "extract": run_extract,
+    }
+
+    def generate():
+        collected = []
+        runner = RUNNERS.get(mode)
+        if runner:
+            for event_str in runner(config):
+                yield event_str
+                try:
+                    data = json.loads(event_str.replace("data: ", "", 1).strip())
+                    if data.get("type") == "response":
+                        collected.append({"model": data.get("model", ""), "text": data.get("text", ""), "role": data.get("role", "")})
+                except Exception:
+                    pass
+        else:
+            yield sse({"type": "response", "model": "system", "text": f"Unknown mode: {mode}", "role": "error"})
+        yield sse({"type": "done"})
+        if collected:
+            save_run(mode, config.get("prompt", ""), config, collected)
+
+    return Response(generate(), mimetype="text/event-stream",
+                    headers={"Cache-Control": "no-cache", "X-Accel-Buffering": "no", "Connection": "keep-alive"})
+
+
+# ─── ORIGINAL 10 MODES ────────────────────────────────────────
+
+def run_brainstorm(config):
+    models, prompt = config.get("models", []), config["prompt"]
+    synthesizer = config.get("synthesizer", models[0] if models else "qwen2.5")
+    yield sse({"type": "clear"})
+    yield sse({"type": "status", "message": f"Querying {len(models)} models..."})
+    responses = parallel_query(models, prompt)
+    for m, r in responses.items():
+        yield sse({"type": "response", "model": m, "text": r, "role": "respondent"})
+    if len(responses) > 1:
+        yield sse({"type": "status", "message": f"Synthesizing with {synthesizer}..."})
+        parts = [("QUESTION:", prompt, 1), ("INSTRUCTION:", "Synthesize the best answer. Be concise.", 1)]
+        for m, r in responses.items():
+            parts.append((f"[{m}]:", cap_response(r), 3))
+        sp = build_context(parts, synthesizer)
+        try:
+            yield sse({"type": "response", "model": synthesizer, "text": safe_query(synthesizer, sp), "role": "synthesis"})
+        except Exception as e:
+            yield sse({"type": "response", "model": synthesizer, "text": str(e), "role": "error"})
+
+
+def run_pipeline(config):
+    steps, current = config.get("steps", []), config["prompt"]
+    yield sse({"type": "clear"})
+    for i, step in enumerate(steps):
+        model = step["model"]
+        yield sse({"type": "status", "message": f"Step {i+1}/{len(steps)}: {model}..."})
+        try:
+            prompt = step["instruction"].replace("{input}", cap_response(current))
+            current = safe_query(model, prompt)
+            yield sse({"type": "response", "model": model, "text": current, "role": f"step {i+1}"})
+        except Exception as e:
+            yield sse({"type": "response", "model": model, "text": str(e), "role": "error"}); break
+
+
+def run_debate(config):
+    prompt, d1, d2, judge = config["prompt"], config["debater1"], config["debater2"], config["judge"]
+    rounds = config.get("rounds", 2)
+    yield sse({"type": "clear"})
+    history = []
+    for m in [d1, d2]:
+        yield sse({"type": "status", "message": f"{m} opening..."})
+        try:
+            r = safe_query(m, f"Give your position on: {prompt}")
+            history.append((m, r)); yield sse({"type": "response", "model": m, "text": r, "role": "opening"})
+        except Exception as e:
+            yield sse({"type": "response", "model": m, "text": str(e), "role": "error"})
+    for rd in range(rounds):
+        for i, m in enumerate([d1, d2]):
+            other = [d1, d2][1-i]
+            other_last = [h[1] for h in history if h[0] == other][-1]
+            yield sse({"type": "status", "message": f"Round {rd+1}: {m}..."})
+            try:
+                rebuttal_prompt = build_context([
+                    ("Topic:", prompt, 1),
+                    (f"Opponent ({other}) said:", cap_response(other_last), 2),
+                    ("INSTRUCTION:", "Rebuttal or concede:", 1),
+                ], m)
+                r = safe_query(m, rebuttal_prompt)
+                history.append((m, r)); yield sse({"type": "response", "model": m, "text": r, "role": f"round {rd+1}"})
+            except Exception as e:
+                yield sse({"type": "response", "model": m, "text": str(e), "role": "error"})
+    yield sse({"type": "status", "message": f"{judge} judging..."})
+    parts = [("Topic:", prompt, 1), ("INSTRUCTION:", "Judge: who won and why?", 1)]
+    for m, t in history:
+        parts.append((f"[{m}]:", cap_response(t), 3))
+    jp = build_context(parts, judge)
+    try:
+        yield sse({"type": "response", "model": judge, "text": safe_query(judge, jp), "role": "judge"})
+    except Exception as e:
+        yield sse({"type": "response", "model": judge, "text": str(e), "role": "error"})
+
+
+def run_validator(config):
+    prompt, answerer, validators = config["prompt"], config["answerer"], config.get("validators", [])
+    yield sse({"type": "clear"})
+    yield sse({"type": "status", "message": f"{answerer} answering..."})
+    try:
+        answer = query_model(answerer, prompt)
+        yield sse({"type": "response", "model": answerer, "text": answer, "role": "answer"})
+    except Exception as e:
+        yield sse({"type": "response", "model": answerer, "text": str(e), "role": "error"}); return
+    yield sse({"type": "status", "message": f"Validating with {len(validators)} models..."})
+    vp = f"QUESTION: {prompt}\n\nANSWER:\n{answer}\n\nFact-check. Score 1-10 for accuracy, completeness, clarity. Flag errors."
+    results = parallel_query(validators, vp)
+    for m, r in results.items():
+        yield sse({"type": "response", "model": m, "text": r, "role": "validator"})
+
+
+def run_roundrobin(config):
+    prompt, models, cycles = config["prompt"], config.get("models", []), config.get("cycles", 2)
+    yield sse({"type": "clear"})
+    if not models: return
+    yield sse({"type": "status", "message": f"{models[0]} drafting..."})
+    try:
+        current = query_model(models[0], f"Answer:\n\n{prompt}")
+        yield sse({"type": "response", "model": models[0], "text": current, "role": "draft"})
+    except Exception as e:
+        yield sse({"type": "response", "model": models[0], "text": str(e), "role": "error"}); return
+    for cycle in range(cycles):
+        start = 1 if cycle == 0 else 0
+        for i in range(start, len(models)):
+            m = models[i]
+            yield sse({"type": "status", "message": f"Cycle {cycle+1}: {m}..."})
+            try:
+                current = query_model(m, f"Question: {prompt}\n\nCurrent answer:\n{current}\n\nImprove it. Return full improved answer.")
+                is_last = (cycle == cycles-1) and (i == len(models)-1)
+                yield sse({"type": "response", "model": m, "text": current, "role": "final" if is_last else f"cycle {cycle+1}"})
+            except Exception as e:
+                yield sse({"type": "response", "model": m, "text": str(e), "role": "error"})
+
+
+def run_redteam(config):
+    prompt, author, attacker, patcher = config["prompt"], config["author"], config["attacker"], config["patcher"]
+    rounds = config.get("rounds", 2)
+    yield sse({"type": "clear"})
+    yield sse({"type": "status", "message": f"{author} writing..."})
+    try:
+        current = query_model(author, prompt)
+        yield sse({"type": "response", "model": author, "text": current, "role": "author"})
+    except Exception as e:
+        yield sse({"type": "response", "model": author, "text": str(e), "role": "error"}); return
+    for r in range(rounds):
+        yield sse({"type": "status", "message": f"Round {r+1}: {attacker} attacking..."})
+        try:
+            attack = query_model(attacker, f"Question: {prompt}\n\nAnswer:\n{current}\n\nRED TEAM: find every flaw, error, weakness, edge case. Be aggressive.")
+            yield sse({"type": "response", "model": attacker, "text": attack, "role": f"attack {r+1}"})
+        except Exception as e:
+            yield sse({"type": "response", "model": attacker, "text": str(e), "role": "error"}); continue
+        yield sse({"type": "status", "message": f"Round {r+1}: {patcher} fixing..."})
+        try:
+            current = query_model(patcher, f"Question: {prompt}\n\nAnswer:\n{current}\n\nFlaws found:\n{attack}\n\nFix ALL issues. Return complete improved answer.")
+            yield sse({"type": "response", "model": patcher, "text": current, "role": "patcher" if r == rounds-1 else f"patch {r+1}"})
+        except Exception as e:
+            yield sse({"type": "response", "model": patcher, "text": str(e), "role": "error"})
+
+
+def run_consensus(config):
+    prompt, models, max_rounds = config["prompt"], config.get("models", []), config.get("max_rounds", 3)
+    yield sse({"type": "clear"})
+    if not models: return
+    yield sse({"type": "status", "message": f"Round 1: {len(models)} models answering..."})
+    responses = parallel_query(models, prompt)
+    for m, r in responses.items():
+        yield sse({"type": "response", "model": m, "text": r, "role": "round 1"})
+    for rd in range(2, max_rounds + 1):
+        yield sse({"type": "status", "message": f"Round {rd}: reviewing each other..."})
+        new = {}
+        for m in models:
+            parts = [("Question:", prompt, 1),
+                     ("Your answer:", cap_response(responses.get(m, "")), 2),
+                     ("INSTRUCTION:", "Revise considering other perspectives. Adopt good points, defend if right.", 1)]
+            for o, r in responses.items():
+                if o != m:
+                    parts.append((f"[{o}]:", cap_response(r), 3))
+            ctx = build_context(parts, m)
+            try:
+                new[m] = safe_query(m, ctx)
+                yield sse({"type": "response", "model": m, "text": new[m], "role": "consensus" if rd == max_rounds else f"round {rd}"})
+            except Exception as e:
+                new[m] = responses.get(m, ""); yield sse({"type": "response", "model": m, "text": str(e), "role": "error"})
+        responses = new
+
+
+def run_codereview(config):
+    prompt, coder, reviewer, tester = config["prompt"], config["coder"], config["reviewer"], config["tester"]
+    yield sse({"type": "clear"})
+    yield sse({"type": "status", "message": f"{coder} coding..."})
+    try:
+        code = query_model(coder, f"Write code for this task. Only output code with brief comments.\n\n{prompt}")
+        yield sse({"type": "response", "model": coder, "text": code, "role": "coder"})
+    except Exception as e:
+        yield sse({"type": "response", "model": coder, "text": str(e), "role": "error"}); return
+    yield sse({"type": "status", "message": f"{reviewer} reviewing..."})
+    try:
+        review = query_model(reviewer, f"Task: {prompt}\n\nCode:\n{code}\n\nReview: bugs, security, performance, style, edge cases. Provide corrected code if needed.")
+        yield sse({"type": "response", "model": reviewer, "text": review, "role": "reviewer"})
+    except Exception as e:
+        review = ""; yield sse({"type": "response", "model": reviewer, "text": str(e), "role": "error"})
+    yield sse({"type": "status", "message": f"{tester} testing..."})
+    try:
+        tests = query_model(tester, f"Task: {prompt}\n\nCode:\n{code}\n\nReview:\n{review}\n\nWrite comprehensive unit tests. Cover normal, edge, error cases.")
+        yield sse({"type": "response", "model": tester, "text": tests, "role": "tester"})
+    except Exception as e:
+        yield sse({"type": "response", "model": tester, "text": str(e), "role": "error"})
+
+
+def run_ladder(config):
+    prompt, models = config["prompt"], config.get("models", [])
+    levels = [
+        ("Child (5yo)", "Explain to a 5-year-old. Very simple words, short sentences, fun analogies."),
+        ("Teenager", "Explain to a 15-year-old. Everyday language, relatable examples, some technical terms."),
+        ("College Student", "College level. Proper terminology, theory, structured explanation."),
+        ("Professional", "Professional level. Technical language, real-world applications, trade-offs."),
+        ("PhD Expert", "PhD/expert level. Nuanced details, current research, math if relevant, edge cases."),
+    ]
+    yield sse({"type": "clear"})
+    for i, (name, instr) in enumerate(levels):
+        m = models[i % len(models)] if models else "qwen2.5"
+        yield sse({"type": "status", "message": f"Level {i+1}/5: {name} ({m})..."})
+        try:
+            yield sse({"type": "response", "model": m, "text": query_model(m, f"{instr}\n\nQuestion: {prompt}"), "role": name})
+        except Exception as e:
+            yield sse({"type": "response", "model": m, "text": str(e), "role": "error"})
+
+
+def run_tournament(config):
+    prompt, models, judge = config["prompt"], config.get("models", []), config.get("judge", "qwen2.5")
+    yield sse({"type": "clear"})
+    yield sse({"type": "status", "message": f"{len(models)} models competing..."})
+    responses = parallel_query(models, prompt)
+    for m, r in responses.items():
+        yield sse({"type": "response", "model": m, "text": r, "role": "competitor"})
+    if len(responses) < 2: return
+    yield sse({"type": "status", "message": f"{judge} ranking..."})
+    parts = [("Question:", prompt, 1),
+             ("INSTRUCTION:", "Rank all from best to worst. Score 1-10 each. Then refine the winner into the ultimate answer.", 1)]
+    for m, r in responses.items():
+        parts.append((f"[{m}]:", cap_response(r), 3))
+    jp = build_context(parts, judge)
+    try:
+        yield sse({"type": "response", "model": judge, "text": safe_query(judge, jp), "role": "verdict"})
+    except Exception as e:
+        yield sse({"type": "response", "model": judge, "text": str(e), "role": "error"})
+
+
+# ─── NEW 7 MODES ──────────────────────────────────────────────
+
+def run_evolution(config):
+    """Genetic algorithm: generate, score, breed, mutate across generations."""
+    prompt, models = config["prompt"], config.get("models", [])
+    generations = config.get("generations", 3)
+    judge = config.get("judge", models[0] if models else "qwen2.5")
+    yield sse({"type": "clear"})
+
+    if not models: return
+
+    # Gen 0: each model generates an answer
+    yield sse({"type": "status", "message": "Generation 0: spawning initial population..."})
+    population = parallel_query(models, prompt)
+    for m, r in population.items():
+        yield sse({"type": "response", "model": m, "text": r, "role": "gen 0"})
+
+    for gen in range(1, generations + 1):
+        # Fitness scoring
+        yield sse({"type": "status", "message": f"Generation {gen}: fitness evaluation..."})
+        score_prompt = f"Question: {prompt}\n\nRate each answer 1-100. Return ONLY a JSON object like {{\"model_name\": score}}.\n\n"
+        for m, r in population.items():
+            score_prompt += f"[{m}]: {r.strip()}\n\n"
+        try:
+            scores_raw = query_model(judge, score_prompt)
+            yield sse({"type": "response", "model": judge, "text": scores_raw, "role": f"fitness gen {gen}"})
+        except Exception as e:
+            yield sse({"type": "response", "model": judge, "text": str(e), "role": "error"}); continue
+
+        # Breed: take top 2 answers, ask a model to combine them
+        pop_list = list(population.items())
+        if len(pop_list) < 2: break
+
+        parent1, parent2 = pop_list[0], pop_list[1]
+        yield sse({"type": "status", "message": f"Generation {gen}: breeding + mutating..."})
+
+        new_population = {}
+        for m in models:
+            breed_prompt = (
+                f"Question: {prompt}\n\n"
+                f"Parent A ({parent1[0]}):\n{parent1[1].strip()}\n\n"
+                f"Parent B ({parent2[0]}):\n{parent2[1].strip()}\n\n"
+                f"You are {m}. Breed these two answers: take the best parts of each parent, "
+                f"combine them, then MUTATE by adding one novel insight or improvement. "
+                f"Return your evolved answer."
+            )
+            try:
+                offspring = query_model(m, breed_prompt)
+                new_population[m] = offspring
+                is_last = gen == generations
+                yield sse({"type": "response", "model": m, "text": offspring, "role": "final" if is_last else f"gen {gen}"})
+            except Exception as e:
+                new_population[m] = population.get(m, "")
+                yield sse({"type": "response", "model": m, "text": str(e), "role": "error"})
+
+        population = new_population
+
+
+def run_blindassembly(config):
+    """Split question into parts, each model answers blind, assembler stitches."""
+    prompt, models = config["prompt"], config.get("models", [])
+    assembler = config.get("assembler", models[0] if models else "qwen2.5")
+    yield sse({"type": "clear"})
+
+    if not models: return
+    n = len(models)
+
+    # Step 1: Decompose the question
+    yield sse({"type": "status", "message": "Decomposing question into sub-tasks..."})
+    decompose_prompt = (
+        f"Split this question into exactly {n} independent sub-parts that together fully answer it. "
+        f"Return ONLY a numbered list, one sub-question per line. No other text.\n\n"
+        f"Question: {prompt}"
+    )
+    try:
+        parts_raw = query_model(assembler, decompose_prompt)
+        yield sse({"type": "response", "model": assembler, "text": parts_raw, "role": "decomposer"})
+    except Exception as e:
+        yield sse({"type": "response", "model": assembler, "text": str(e), "role": "error"}); return
+
+    # Parse parts
+    parts = [line.strip() for line in parts_raw.strip().split("\n") if line.strip() and any(c.isalpha() for c in line)]
+    while len(parts) < n:
+        parts.append(f"Additional aspect of: {prompt}")
+    parts = parts[:n]
+
+    # Step 2: Each model answers their part BLIND
+    yield sse({"type": "status", "message": f"Sending {n} sub-tasks to models (blind)..."})
+    fragments = {}
+    with ThreadPoolExecutor(max_workers=n) as pool:
+        futures = {}
+        for i, m in enumerate(models):
+            blind_prompt = (
+                f"Answer ONLY this specific sub-question. Do not address anything else.\n\n"
+                f"Sub-question: {parts[i]}"
+            )
+            futures[pool.submit(query_model, m, blind_prompt)] = (m, parts[i])
+
+        for future in as_completed(futures):
+            m, part = futures[future]
+            try:
+                fragments[m] = {"part": part, "answer": future.result()}
+                yield sse({"type": "response", "model": m, "text": f"SUB-TASK: {part}\n\nANSWER:\n{fragments[m]['answer']}", "role": "blind worker"})
+            except Exception as e:
+                yield sse({"type": "response", "model": m, "text": str(e), "role": "error"})
+
+    # Step 3: Assemble
+    yield sse({"type": "status", "message": f"{assembler} assembling blind fragments..."})
+    assemble_prompt = f"Original question: {prompt}\n\nMultiple models each answered a sub-part WITHOUT seeing each other:\n\n"
+    for m, data in fragments.items():
+        assemble_prompt += f"[{m}] (sub-task: {data['part']}):\n{data['answer'].strip()}\n\n"
+    assemble_prompt += "Stitch these fragments into ONE coherent, complete answer. Fill any gaps. Remove contradictions."
+
+    try:
+        yield sse({"type": "response", "model": assembler, "text": query_model(assembler, assemble_prompt), "role": "assembler"})
+    except Exception as e:
+        yield sse({"type": "response", "model": assembler, "text": str(e), "role": "error"})
+
+
+def run_staircase(config):
+    """Devil's Staircase: each round adds a new constraint."""
+    prompt = config["prompt"]
+    answerer = config["answerer"]
+    challenger = config["challenger"]
+    steps = config.get("steps", 4)
+    yield sse({"type": "clear"})
+
+    # Initial answer
+    yield sse({"type": "status", "message": f"{answerer} answering..."})
+    try:
+        current = query_model(answerer, prompt)
+        yield sse({"type": "response", "model": answerer, "text": current, "role": "initial answer"})
+    except Exception as e:
+        yield sse({"type": "response", "model": answerer, "text": str(e), "role": "error"}); return
+
+    constraints = []
+    for s in range(steps):
+        # Challenger adds a constraint
+        yield sse({"type": "status", "message": f"Step {s+1}: {challenger} adding constraint..."})
+        constraint_prompt = (
+            f"Original question: {prompt}\n\n"
+            f"Current answer:\n{current}\n\n"
+            f"Existing constraints: {constraints if constraints else 'None yet'}\n\n"
+            f"Add ONE new realistic constraint, complication, or edge case that the current answer doesn't handle. "
+            f"Make it specific and challenging but plausible. State ONLY the new constraint, nothing else."
+        )
+        try:
+            new_constraint = query_model(challenger, constraint_prompt)
+            constraints.append(new_constraint.strip())
+            yield sse({"type": "response", "model": challenger, "text": new_constraint, "role": f"constraint {s+1}"})
+        except Exception as e:
+            yield sse({"type": "response", "model": challenger, "text": str(e), "role": "error"}); continue
+
+        # Answerer must adapt
+        yield sse({"type": "status", "message": f"Step {s+1}: {answerer} adapting..."})
+        adapt_prompt = (
+            f"Original question: {prompt}\n\n"
+            f"ALL constraints you must satisfy:\n" +
+            "\n".join(f"  {i+1}. {c}" for i, c in enumerate(constraints)) +
+            f"\n\nYour previous answer:\n{current}\n\n"
+            f"Rewrite your answer to handle ALL constraints. Return the complete updated answer."
+        )
+        try:
+            current = query_model(answerer, adapt_prompt)
+            is_last = s == steps - 1
+            yield sse({"type": "response", "model": answerer, "text": current, "role": "final" if is_last else f"adapted {s+1}"})
+        except Exception as e:
+            yield sse({"type": "response", "model": answerer, "text": str(e), "role": "error"})
+
+
+def run_drift(config):
+    """Same prompt N times to same model, analyze variance."""
+    prompt = config["prompt"]
+    target = config["target"]
+    samples = config.get("samples", 5)
+    analyzer = config["analyzer"]
+    yield sse({"type": "clear"})
+
+    yield sse({"type": "status", "message": f"Sampling {target} {samples} times..."})
+    results = []
+    for i in range(samples):
+        yield sse({"type": "status", "message": f"Sample {i+1}/{samples}..."})
+        try:
+            r = query_model(target, prompt)
+            results.append(r)
+            yield sse({"type": "response", "model": target, "text": r, "role": f"sample {i+1}"})
+        except Exception as e:
+            yield sse({"type": "response", "model": target, "text": str(e), "role": "error"})
+
+    if len(results) < 2: return
+
+    # Analyze
+    yield sse({"type": "status", "message": f"{analyzer} analyzing drift..."})
+    analysis_prompt = (
+        f"Question asked: {prompt}\n\n"
+        f"The model '{target}' was asked this same question {len(results)} times. Here are all responses:\n\n"
+    )
+    for i, r in enumerate(results):
+        analysis_prompt += f"--- Sample {i+1} ---\n{r.strip()}\n\n"
+
+    analysis_prompt += (
+        "DRIFT ANALYSIS:\n"
+        "1. What claims/facts are CONSISTENT across all samples? (HIGH CONFIDENCE)\n"
+        "2. What claims VARY between samples? (LOW CONFIDENCE - possible hallucination)\n"
+        "3. What is completely CONTRADICTED between samples? (UNRELIABLE)\n"
+        "4. Give an overall confidence score 1-10 for the model's answer to this question.\n"
+        "5. Provide the 'true' answer using only high-confidence claims."
+    )
+    try:
+        yield sse({"type": "response", "model": analyzer, "text": query_model(analyzer, analysis_prompt), "role": "analyzer"})
+    except Exception as e:
+        yield sse({"type": "response", "model": analyzer, "text": str(e), "role": "error"})
+
+
+def run_mesh(config):
+    """Each model answers as a different stakeholder."""
+    prompt, models = config["prompt"], config.get("models", [])
+    synthesizer = config.get("synthesizer", models[0] if models else "qwen2.5")
+    yield sse({"type": "clear"})
+
+    perspectives = [
+        ("CEO / Business Leader", "You are a CEO. Answer from a business strategy perspective: ROI, market impact, competitive advantage, risk."),
+        ("Software Engineer", "You are a senior engineer. Answer from a technical perspective: architecture, implementation, scalability, tech debt."),
+        ("End User / Customer", "You are an end user/customer. Answer from a usability perspective: experience, pain points, what you actually need."),
+        ("Regulator / Legal", "You are a regulator/legal advisor. Answer from a compliance perspective: laws, regulations, liability, ethics, privacy."),
+        ("Competitor", "You are a competitor analyzing this. What threats/opportunities does this create? What would you do differently?"),
+    ]
+
+    if not models: return
+
+    responses = {}
+    for i, (role_name, instruction) in enumerate(perspectives):
+        m = models[i % len(models)]
+        yield sse({"type": "status", "message": f"{role_name}: {m}..."})
+        try:
+            r = query_model(m, f"{instruction}\n\nQuestion: {prompt}")
+            responses[role_name] = (m, r)
+            yield sse({"type": "response", "model": m, "text": r, "role": role_name})
+        except Exception as e:
+            yield sse({"type": "response", "model": m, "text": str(e), "role": "error"})
+
+    # 360 synthesis
+    yield sse({"type": "status", "message": f"{synthesizer} weaving 360-degree view..."})
+    syn = f"Question: {prompt}\n\nMultiple stakeholders gave their perspective:\n\n"
+    for role, (m, r) in responses.items():
+        syn += f"[{role} ({m})]: {r.strip()}\n\n"
+    syn += "Synthesize a 360-degree view that balances all stakeholder perspectives. Highlight tensions and trade-offs."
+    try:
+        yield sse({"type": "response", "model": synthesizer, "text": query_model(synthesizer, syn), "role": "mesh-360"})
+    except Exception as e:
+        yield sse({"type": "response", "model": synthesizer, "text": str(e), "role": "error"})
+
+
+def run_hallucination(config):
+    """One answers, hunters verify each claim independently."""
+    prompt, answerer = config["prompt"], config["answerer"]
+    hunters = config.get("hunters", [])
+    yield sse({"type": "clear"})
+
+    # Get answer
+    yield sse({"type": "status", "message": f"{answerer} answering..."})
+    try:
+        answer = query_model(answerer, prompt)
+        yield sse({"type": "response", "model": answerer, "text": answer, "role": "answer"})
+    except Exception as e:
+        yield sse({"type": "response", "model": answerer, "text": str(e), "role": "error"}); return
+
+    # Extract claims
+    yield sse({"type": "status", "message": "Extracting factual claims..."})
+    extract_prompt = (
+        f"Extract every factual claim from this answer as a numbered list. Include specific facts, numbers, dates, "
+        f"names, and cause-effect relationships. One claim per line.\n\nAnswer:\n{answer}"
+    )
+    try:
+        claims = query_model(answerer, extract_prompt)
+        yield sse({"type": "response", "model": answerer, "text": claims, "role": "claims extracted"})
+    except Exception as e:
+        yield sse({"type": "response", "model": answerer, "text": str(e), "role": "error"}); return
+
+    # Each hunter verifies independently
+    yield sse({"type": "status", "message": f"{len(hunters)} hunters verifying claims..."})
+    hunt_prompt = (
+        f"Original question: {prompt}\n\n"
+        f"An AI generated this answer:\n{answer}\n\n"
+        f"Here are the extracted claims:\n{claims}\n\n"
+        f"For EACH claim, verdict:\n"
+        f"  VERIFIED - you are confident this is correct\n"
+        f"  SUSPICIOUS - might be wrong or misleading\n"
+        f"  HALLUCINATED - this is likely made up or incorrect\n"
+        f"  UNVERIFIABLE - cannot determine from your knowledge\n"
+        f"Explain your reasoning for suspicious/hallucinated claims."
+    )
+    results = parallel_query(hunters, hunt_prompt)
+    for m, r in results.items():
+        yield sse({"type": "response", "model": m, "text": r, "role": "hunter"})
+
+
+def run_timeloop(config):
+    """CHAOS MODE: answer -> catastrophe -> fix -> new catastrophe -> repeat."""
+    prompt = config["prompt"]
+    answerer = config["answerer"]
+    chaos = config["chaos"]
+    loops = config.get("loops", 4)
+    yield sse({"type": "clear"})
+
+    # Initial answer
+    yield sse({"type": "status", "message": f"{answerer} answering (unaware of impending doom)..."})
+    try:
+        current = query_model(answerer, prompt)
+        yield sse({"type": "response", "model": answerer, "text": current, "role": "initial (doomed)"})
+    except Exception as e:
+        yield sse({"type": "response", "model": answerer, "text": str(e), "role": "error"}); return
+
+    catastrophes = []
+    for i in range(loops):
+        # Chaos agent creates a catastrophe
+        yield sse({"type": "status", "message": f"Loop {i+1}: CHAOS AGENT unleashed..."})
+        chaos_prompt = (
+            f"Original question: {prompt}\n\n"
+            f"Someone implemented this answer:\n{current}\n\n"
+            f"Previous catastrophes that were already fixed: {catastrophes if catastrophes else 'None yet'}\n\n"
+            f"You are a CHAOS AGENT. Describe a SPECIFIC, VIVID catastrophe that happened because of a flaw "
+            f"in this answer. Be creative and dramatic but grounded in a real flaw. "
+            f"Describe: 1) What went wrong 2) The cascading consequences 3) Who/what was affected. "
+            f"Make it different from previous catastrophes. Be theatrical!"
+        )
+        try:
+            catastrophe = query_model(chaos, chaos_prompt)
+            catastrophes.append(catastrophe.strip()[:200])
+            yield sse({"type": "response", "model": chaos, "text": catastrophe, "role": f"catastrophe {i+1}"})
+        except Exception as e:
+            yield sse({"type": "response", "model": chaos, "text": str(e), "role": "error"}); continue
+
+        # Answerer must fix
+        yield sse({"type": "status", "message": f"Loop {i+1}: {answerer} desperately fixing..."})
+        fix_prompt = (
+            f"Original question: {prompt}\n\n"
+            f"Your previous answer:\n{current}\n\n"
+            f"CATASTROPHE REPORT:\n{catastrophe}\n\n"
+            f"ALL previous catastrophes you must also prevent:\n" +
+            "\n".join(f"  {j+1}. {c}" for j, c in enumerate(catastrophes)) +
+            f"\n\nRewrite your answer to prevent THIS catastrophe and ALL previous ones. "
+            f"Your answer must be BULLETPROOF. Return the complete fixed answer."
+        )
+        try:
+            current = query_model(answerer, fix_prompt)
+            is_last = i == loops - 1
+            yield sse({"type": "response", "model": answerer, "text": current, "role": "survivor" if is_last else f"fix {i+1}"})
+        except Exception as e:
+            yield sse({"type": "response", "model": answerer, "text": str(e), "role": "error"})
+
+    # Final verdict from chaos agent
+    yield sse({"type": "status", "message": f"{chaos} final inspection..."})
+    final_prompt = (
+        f"Original question: {prompt}\n\n"
+        f"After {loops} catastrophes, the final answer is:\n{current}\n\n"
+        f"All catastrophes it survived:\n" +
+        "\n".join(f"  {j+1}. {c}" for j, c in enumerate(catastrophes)) +
+        f"\n\nAs the Chaos Agent, give your final verdict: Is this answer now truly bulletproof? "
+        f"Rate its resilience 1-10. Can you find ONE MORE flaw? If not, admit defeat."
+    )
+    try:
+        yield sse({"type": "response", "model": chaos, "text": query_model(chaos, final_prompt), "role": "final judgment"})
+    except Exception as e:
+        yield sse({"type": "response", "model": chaos, "text": str(e), "role": "error"})
+
+
+# ─── AUTONOMOUS PIPELINES ─────────────────────────────────────
+
+def _save_pipeline(pipeline, topic, steps, result, models, start_ms):
+    import time
+    duration = int((time.time() * 1000) - start_ms)
+    try:
+        with get_db() as conn:
+            with conn.cursor() as cur:
+                cur.execute(
+                    """INSERT INTO pipeline_runs (pipeline, topic, status, steps, result, models_used, duration_ms, completed_at)
+                       VALUES (%s, %s, 'completed', %s, %s, %s, %s, NOW())""",
+                    (pipeline, topic, json.dumps(steps), json.dumps(result), list(set(models)), duration)
+                )
+            conn.commit()
+    except Exception as e:
+        print(f"[DB] pipeline save error: {e}")
+
+
+def run_research(config):
+    """Autonomous research pipeline: scout → parallel research → fact-check → synthesize."""
+    import time
+    start = time.time() * 1000
+    prompt = config["prompt"]
+    scout = config.get("scout", "llama3.2:latest")
+    models = config.get("models", [])
+    checker = config.get("checker", models[0] if models else scout)
+    synth = config.get("synthesizer", models[0] if models else scout)
+    num_q = config.get("num_questions", 5)
+    yield sse({"type": "clear"})
+    steps = []
+    all_models = [scout, checker, synth] + models
+
+    # Step 1: Scout generates research questions
+    yield sse({"type": "status", "message": f"Step 1/4: {scout} generating {num_q} research questions..."})
+    try:
+        q_prompt = (
+            f"You are a research scout. Given the topic below, generate exactly {num_q} specific, "
+            f"diverse research questions that would build a comprehensive understanding. "
+            f"Return ONLY a numbered list.\n\nTopic: {prompt}"
+        )
+        questions_raw = query_model(scout, q_prompt)
+        yield sse({"type": "response", "model": scout, "text": questions_raw, "role": "scout"})
+        steps.append({"step": "scout", "model": scout, "output": questions_raw})
+    except Exception as e:
+        yield sse({"type": "response", "model": scout, "text": str(e), "role": "error"})
+        return
+
+    # Parse questions
+    questions = [l.strip() for l in questions_raw.strip().split("\n") if l.strip() and any(c.isalpha() for c in l)]
+    questions = questions[:num_q]
+    if not questions:
+        yield sse({"type": "response", "model": "system", "text": "Failed to parse research questions.", "role": "error"})
+        return
+
+    # Step 2: Parallel research — distribute questions across models
+    yield sse({"type": "status", "message": f"Step 2/4: {len(models)} models researching {len(questions)} questions..."})
+    research_results = {}
+    with ThreadPoolExecutor(max_workers=max(len(models), 1)) as pool:
+        futures = {}
+        for i, q in enumerate(questions):
+            m = models[i % len(models)] if models else scout
+            rp = f"Research this question thoroughly. Provide specific facts, data, and examples.\n\nQuestion: {q}"
+            futures[pool.submit(query_model, m, rp)] = (m, q)
+        for future in as_completed(futures):
+            m, q = futures[future]
+            try:
+                answer = future.result()
+                research_results[q] = {"model": m, "answer": answer}
+                yield sse({"type": "response", "model": m, "text": f"Q: {q}\n\n{answer}", "role": "researcher"})
+            except Exception as e:
+                yield sse({"type": "response", "model": m, "text": f"Q: {q}\n\nError: {e}", "role": "error"})
+                research_results[q] = {"model": m, "answer": f"Error: {e}"}
+    steps.append({"step": "research", "results": {q: r["answer"][:500] for q, r in research_results.items()}})
+
+    # Step 3: Fact-check
+    yield sse({"type": "status", "message": f"Step 3/4: {checker} fact-checking all findings..."})
+    check_prompt = f"Topic: {prompt}\n\nResearch findings to fact-check:\n\n"
+    for q, r in research_results.items():
+        check_prompt += f"Q: {q}\nA: {r['answer'][:300]}\n\n"
+    check_prompt += (
+        "For each finding, mark as:\n"
+        "  VERIFIED — likely accurate\n"
+        "  UNCERTAIN — may be wrong or outdated\n"
+        "  FLAGGED — likely inaccurate\n"
+        "Be specific about what's wrong with flagged items."
+    )
+    try:
+        check_result = query_model(checker, check_prompt)
+        yield sse({"type": "response", "model": checker, "text": check_result, "role": "fact-checker"})
+        steps.append({"step": "fact-check", "model": checker, "output": check_result[:1000]})
+    except Exception as e:
+        check_result = f"Error: {e}"
+        yield sse({"type": "response", "model": checker, "text": str(e), "role": "error"})
+
+    # Step 4: Synthesize into brief
+    yield sse({"type": "status", "message": f"Step 4/4: {synth} synthesizing research brief..."})
+    synth_prompt = f"Topic: {prompt}\n\nResearch findings:\n\n"
+    for q, r in research_results.items():
+        synth_prompt += f"Q: {q}\nA: {r['answer'][:400]}\n\n"
+    synth_prompt += f"\nFact-check notes:\n{check_result[:500]}\n\n"
+    synth_prompt += (
+        "Synthesize ALL findings into a structured research brief with these sections:\n"
+        "1. EXECUTIVE SUMMARY (2-3 sentences)\n"
+        "2. KEY FINDINGS (bulleted list)\n"
+        "3. DETAILED ANALYSIS (organized by theme)\n"
+        "4. UNCERTAINTIES & GAPS (what needs more research)\n"
+        "5. RECOMMENDATIONS (actionable next steps)\n"
+        "Be comprehensive but concise."
+    )
+    try:
+        brief = query_model(synth, synth_prompt)
+        yield sse({"type": "response", "model": synth, "text": brief, "role": "synthesis"})
+        steps.append({"step": "synthesis", "model": synth, "output": brief[:2000]})
+    except Exception as e:
+        brief = f"Error: {e}"
+        yield sse({"type": "response", "model": synth, "text": str(e), "role": "error"})
+
+    # Save pipeline run
+    _save_pipeline("research", prompt, steps, {"brief": brief, "questions": questions, "fact_check": check_result[:1000]}, all_models, start)
+
+
+def run_eval(config):
+    """Model evaluation pipeline: same prompts → all models → judge scores → leaderboard."""
+    import time
+    start = time.time() * 1000
+    prompt = config["prompt"]
+    models = config.get("models", [])
+    judge = config.get("judge", models[0] if models else "qwen2.5:latest")
+    eval_type = config.get("eval_type", "general")
+    rounds = config.get("rounds", 3)
+    yield sse({"type": "clear"})
+    steps = []
+    all_models = models + [judge]
+
+    # Generate eval prompts based on type
+    yield sse({"type": "status", "message": f"Generating {rounds} {eval_type} evaluation prompts..."})
+    gen_prompt = (
+        f"Generate exactly {rounds} evaluation prompts for testing LLM capability in: {eval_type}.\n"
+        f"Context/focus area: {prompt}\n\n"
+        f"Each prompt should test a different aspect. Return ONLY a numbered list of prompts, nothing else."
+    )
+    try:
+        prompts_raw = query_model(judge, gen_prompt)
+        yield sse({"type": "response", "model": judge, "text": prompts_raw, "role": "prompt generator"})
+    except Exception as e:
+        yield sse({"type": "response", "model": judge, "text": str(e), "role": "error"})
+        return
+
+    eval_prompts = [l.strip() for l in prompts_raw.strip().split("\n") if l.strip() and any(c.isalpha() for c in l)]
+    eval_prompts = eval_prompts[:rounds]
+    if not eval_prompts:
+        yield sse({"type": "response", "model": "system", "text": "Failed to generate eval prompts.", "role": "error"})
+        return
+
+    # Run each prompt against all models
+    scores = {m: [] for m in models}
+    for ri, ep in enumerate(eval_prompts):
+        yield sse({"type": "status", "message": f"Round {ri+1}/{len(eval_prompts)}: Testing {len(models)} models..."})
+
+        # All models answer in parallel
+        responses = parallel_query(models, ep)
+        for m, r in responses.items():
+            yield sse({"type": "response", "model": m, "text": f"[Round {ri+1}] {ep[:80]}...\n\n{r}", "role": f"round {ri+1}"})
+
+        # Judge scores all responses
+        yield sse({"type": "status", "message": f"Round {ri+1}: Judging..."})
+        judge_prompt = (
+            f"Evaluation prompt: {ep}\n\n"
+            f"Score each model's response 1-10 on: accuracy, completeness, clarity, reasoning.\n"
+            f"Return a JSON object: {{\"model_name\": {{\"score\": N, \"notes\": \"brief note\"}}}}.\n\n"
+        )
+        for m, r in responses.items():
+            judge_prompt += f"[{m}]:\n{r[:500]}\n\n"
+        try:
+            judgment = query_model(judge, judge_prompt)
+            yield sse({"type": "response", "model": judge, "text": judgment, "role": f"judge round {ri+1}"})
+            # Try to parse scores
+            try:
+                import re
+                # Find numbers after model names
+                for m in models:
+                    # Look for score patterns near model name
+                    pattern = re.escape(m) + r'.*?["\s:]+(\d+)'
+                    match = re.search(pattern, judgment, re.IGNORECASE | re.DOTALL)
+                    if match:
+                        scores[m].append(int(match.group(1)))
+            except Exception:
+                pass
+        except Exception as e:
+            yield sse({"type": "response", "model": judge, "text": str(e), "role": "error"})
+
+        steps.append({"round": ri+1, "prompt": ep, "responses": {m: r[:300] for m, r in responses.items()}})
+
+    # Final leaderboard
+    yield sse({"type": "status", "message": "Generating leaderboard..."})
+    leaderboard = []
+    for m in models:
+        avg = sum(scores[m]) / len(scores[m]) if scores[m] else 0
+        leaderboard.append({"model": m, "avg_score": round(avg, 1), "rounds": len(scores[m]), "scores": scores[m]})
+    leaderboard.sort(key=lambda x: x["avg_score"], reverse=True)
+
+    board_text = f"LEADERBOARD — {eval_type.upper()} ({len(eval_prompts)} rounds)\n{'='*50}\n\n"
+    for i, entry in enumerate(leaderboard):
+        medal = ["1st", "2nd", "3rd"][i] if i < 3 else f"{i+1}th"
+        bar = "#" * int(entry["avg_score"])
+        board_text += f"  {medal}  {entry['model']:<30} {entry['avg_score']:>4}/10  {bar}\n"
+        if entry["scores"]:
+            board_text += f"       Round scores: {entry['scores']}\n\n"
+
+    yield sse({"type": "response", "model": judge, "text": board_text, "role": "final"})
+
+    _save_pipeline("eval", prompt, steps, {"leaderboard": leaderboard, "eval_type": eval_type}, all_models, start)
+
+
+def run_extract(config):
+    """Knowledge extraction pipeline: chunk text → extract facts → verify → structured output."""
+    import time
+    start = time.time() * 1000
+    prompt = config["prompt"]
+    extractor = config.get("extractor", "qwen2.5:latest")
+    verifier = config.get("verifier", "gemma2:latest")
+    source = config.get("source", "prompt")
+    yield sse({"type": "clear"})
+    steps = []
+    all_models = [extractor, verifier]
+
+    # Get source text
+    source_text = prompt
+    if source != "prompt":
+        file_map = {
+            "ontology": "/home/profit/ONTOLOGY.md",
+            "index": "/home/profit/INDEX.md",
+            "summaries": "/home/profit/SUMMARIES.md",
+            "guides": "/home/profit/GUIDES.md",
+        }
+        fpath = file_map.get(source)
+        if fpath and os.path.exists(fpath):
+            yield sse({"type": "status", "message": f"Reading {source}..."})
+            with open(fpath) as f:
+                source_text = f.read()[:15000]  # limit to ~15K chars
+            yield sse({"type": "response", "model": "system", "text": f"Loaded {source} ({len(source_text)} chars)", "role": "source"})
+        else:
+            yield sse({"type": "response", "model": "system", "text": f"File not found: {source}", "role": "error"})
+            return
+
+    # Chunk if too long
+    chunks = []
+    chunk_size = 4000
+    for i in range(0, len(source_text), chunk_size):
+        chunks.append(source_text[i:i+chunk_size])
+
+    yield sse({"type": "status", "message": f"Processing {len(chunks)} chunk(s) with {extractor}..."})
+
+    all_facts = []
+    all_entities = []
+    all_relations = []
+
+    for ci, chunk in enumerate(chunks):
+        yield sse({"type": "status", "message": f"Extracting from chunk {ci+1}/{len(chunks)}..."})
+        extract_prompt = (
+            f"Extract structured knowledge from this text. Return a JSON object with:\n"
+            f"  \"facts\": [\"fact 1\", \"fact 2\", ...],\n"
+            f"  \"entities\": [{{\"name\": \"...\", \"type\": \"...\", \"description\": \"...\"}}, ...],\n"
+            f"  \"relationships\": [{{\"from\": \"...\", \"to\": \"...\", \"type\": \"...\"}}, ...]\n\n"
+            f"Be thorough. Extract EVERY factual claim, named entity, and relationship.\n\n"
+            f"Text:\n{chunk}"
+        )
+        try:
+            result = query_model(extractor, extract_prompt)
+            yield sse({"type": "response", "model": extractor, "text": result, "role": f"extraction {ci+1}"})
+            # Try to parse JSON from response
+            try:
+                import re
+                json_match = re.search(r'\{[\s\S]*\}', result)
+                if json_match:
+                    parsed = json.loads(json_match.group())
+                    all_facts.extend(parsed.get("facts", []))
+                    all_entities.extend(parsed.get("entities", []))
+                    all_relations.extend(parsed.get("relationships", []))
+            except Exception:
+                all_facts.append(result[:500])
+        except Exception as e:
+            yield sse({"type": "response", "model": extractor, "text": str(e), "role": "error"})
+
+    steps.append({"step": "extraction", "facts": len(all_facts), "entities": len(all_entities), "relations": len(all_relations)})
+
+    # Verify key facts
+    yield sse({"type": "status", "message": f"{verifier} verifying {len(all_facts)} facts..."})
+    facts_sample = all_facts[:20]  # verify up to 20
+    verify_prompt = (
+        f"Verify these extracted facts. For each, mark CORRECT, INCORRECT, or UNVERIFIABLE.\n"
+        f"If incorrect, provide the correction.\n\n"
+    )
+    for i, f in enumerate(facts_sample):
+        fact_str = f if isinstance(f, str) else json.dumps(f)
+        verify_prompt += f"{i+1}. {fact_str}\n"
+    try:
+        verification = query_model(verifier, verify_prompt)
+        yield sse({"type": "response", "model": verifier, "text": verification, "role": "verifier"})
+        steps.append({"step": "verification", "model": verifier, "output": verification[:1000]})
+    except Exception as e:
+        verification = str(e)
+        yield sse({"type": "response", "model": verifier, "text": str(e), "role": "error"})
+
+    # Summary
+    summary = (
+        f"KNOWLEDGE EXTRACTION SUMMARY\n{'='*40}\n\n"
+        f"Source: {source}\n"
+        f"Facts extracted: {len(all_facts)}\n"
+        f"Entities found: {len(all_entities)}\n"
+        f"Relationships mapped: {len(all_relations)}\n\n"
+        f"TOP ENTITIES:\n"
+    )
+    for e in all_entities[:15]:
+        if isinstance(e, dict):
+            summary += f"  [{e.get('type','?')}] {e.get('name','?')} — {e.get('description','')[:60]}\n"
+    summary += f"\nTOP RELATIONSHIPS:\n"
+    for r in all_relations[:15]:
+        if isinstance(r, dict):
+            summary += f"  {r.get('from','?')} --[{r.get('type','?')}]--> {r.get('to','?')}\n"
+
+    yield sse({"type": "response", "model": "system", "text": summary, "role": "final"})
+
+    result_data = {
+        "facts": all_facts[:100],
+        "entities": all_entities[:50],
+        "relationships": all_relations[:50],
+        "verification": verification[:1000],
+        "source": source,
+    }
+    _save_pipeline("extract", prompt or source, steps, result_data, all_models, start)
+
+
+if __name__ == "__main__":
+    print("\n  LLM Team UI running at http://localhost:5000\n")
+    app.run(host="0.0.0.0", port=5000, debug=False)
diff --git a/schema.sql b/schema.sql
new file mode 100644
index 0000000..af7690c
--- /dev/null
+++ b/schema.sql
@@ -0,0 +1,54 @@
+-- LLM Team UI Database Schema
+-- Run against PostgreSQL: psql -d knowledge_base -f schema.sql
+
+CREATE TABLE IF NOT EXISTS team_runs (
+    id SERIAL PRIMARY KEY,
+    mode TEXT NOT NULL,
+    prompt TEXT NOT NULL,
+    config JSONB,
+    responses JSONB NOT NULL DEFAULT '[]',
+    models_used TEXT[],
+    created_at TIMESTAMPTZ DEFAULT NOW()
+);
+
+CREATE TABLE IF NOT EXISTS pipeline_runs (
+    id SERIAL PRIMARY KEY,
+    pipeline TEXT NOT NULL,
+    topic TEXT NOT NULL,
+    status TEXT DEFAULT 'running',
+    steps JSONB DEFAULT '[]',
+    result JSONB,
+    models_used TEXT[],
+    duration_ms INTEGER,
+    created_at TIMESTAMPTZ DEFAULT NOW(),
+    completed_at TIMESTAMPTZ
+);
+
+CREATE TABLE IF NOT EXISTS lab_experiments (
+    id SERIAL PRIMARY KEY,
+    name TEXT NOT NULL,
+    status TEXT DEFAULT 'idle',
+    objective TEXT,
+    metric TEXT DEFAULT 'quality',
+    eval_cases JSONB DEFAULT '[]',
+    mutable_config JSONB DEFAULT '{}',
+    best_config JSONB,
+    best_score FLOAT DEFAULT 0,
+    total_trials INTEGER DEFAULT 0,
+    improvements INTEGER DEFAULT 0,
+    models_pool TEXT[],
+    created_at TIMESTAMPTZ DEFAULT NOW()
+);
+
+CREATE TABLE IF NOT EXISTS lab_trials (
+    id SERIAL PRIMARY KEY,
+    experiment_id INTEGER REFERENCES lab_experiments(id) ON DELETE CASCADE,
+    trial_num INTEGER,
+    config_diff TEXT,
+    config_snapshot JSONB,
+    scores JSONB,
+    avg_score FLOAT,
+    improved BOOLEAN DEFAULT FALSE,
+    duration_ms INTEGER,
+    created_at TIMESTAMPTZ DEFAULT NOW()
+);