RelayForge AI маршрутизирует, стримит и восстанавливается как реальный AI infrastructure продукт.
Одна API-поверхность, несколько провайдеров, нормализованные ошибки и устойчивый fallback от Groq Free к OpenRouter Free и далее к demo-safe mock-провайдеру.
Превью gateway
Playground UI коммерческого уровня с видимостью маршрутизации.
data: {"strategy":"auto","attemptedProvider":"groq","finalProvider":"openrouter","fallbackActivated":true}
event: token
data: {"value":"RelayForge keeps the response moving..."}
Премиальный dashboard UI для скриншотов и интервью.
Продуктовая поверхность объединяет streaming UX, статусы провайдеров и observability-аналитику в цельное демо developer-инфраструктуры.
Один интерфейс, несколько провайдеров, устойчивость по дизайну.
Единая AI API-поверхность
Отправляйте промпты в едином формате запроса, а RelayForge нормализует поведение разных провайдеров.
Стриминг в реальном времени
Постепенная отрисовка токенов через SSE-совместимые стримы со стабильным layout и аккуратной обработкой прерываний.
Автоматический fallback
Основной путь: Groq Free. При проблемах включаются free-модели OpenRouter, а mock-режим гарантирует рабочее публичное демо.
Нормализованные ошибки
Ошибки валидации, rate-limit, timeout и некорректный upstream-ответ возвращаются в едином контракте.
Видимость провайдеров
Показывайте порядок маршрутизации, режим системы, задержку и готовность провайдеров в observability-стиле.
Архитектура free-tier-first
Статический frontend на Pages и API на Worker дают публичный, дешевый и устойчивый деплой при ограниченных квотах.
Как это работает
1. Валидация и нормализация запроса.
Стриминг-путь
2. Открывается provider-stream и токены отдаются постепенно.
Resilience-путь
3. При ошибке upstream запрос поднимается на следующий уровень.
Стримьте ответы в реальном времени
Держите output-панель активной с прогрессивной выдачей токенов и стабильной версткой.
Fallback без драмы
Маршрутизация остается явной: пользователь видит, что пытались вызвать и кто реально отдал ответ.
Спроектировано под free-tier ограничения, а не вопреки им.
Groq Free
Низкая задержка по умолчанию для лучшего real-time UX.
OpenRouter Free
Включается, когда Groq ограничен, временно недоступен или возвращает некорректный ответ.
Mock / Demo
Псевдо-стриминг, который гарантирует тестируемость публичного демо.
Статический frontend. Serverless gateway. Секреты только на edge.
Cloudflare Pages хостит премиальный UI как статический export. Cloudflare Workers обрабатывают оркестрацию провайдеров, стриминг, нормализованные ошибки и телеметрию без платной backend-инфраструктуры.
Портфолио-проект, который ведет себя как реальный AI infra продукт.
Откройте песочницу, проверьте маршрутизацию провайдеров, изучите docs и используйте dashboard как практический архитектурный walkthrough на интервью.