AIиавтоматизация
AI-воркфлоу, которые заменяют ручные передачи — биллинг, онбординг, триаж, контент-операции. Из Нови-Сада (Сербия) для студий по Балканам и ЕС. Frontier-модели когда нужны, self-hosted Llama или Mistral когда токены важны.
- От
- €4,500
- Сроки
- 4–8 weeks
- Стек
- n8nTemporalInngestClaude APIOpenAIOllama (self-hosted)Llama 3MistralLangGraph
Что получите
Что получите
- 01Инвентарь воркфлоу и ROI-модель
- 02Оркестрация n8n, Temporal или Inngest
- 03LLM-шаги — Claude / GPT или self-hosted Llama 3 / Mistral
- 04Evaluation-обвязка (golden sets, регресс-тесты)
- 05Human-in-the-loop очереди ревью где нужно
- 06Cost-дашборд: токены, GPU-часы, flat rate в сравнении
Как делаем
Как делаем
Скоуп
Выбираем 2–3 воркфлоу с явным ROI. От остальных честно отказываемся.
Прототип
Сквозной рабочий срез на второй неделе, пусть и некрасивый.
Harden
Evals, гардрейлы, мониторинг. Offline Llama / Mistral на вашем GPU — без платы за токены.
Передача
Команда правит, переобучает и расширяет без звонков нам.
Связанные работы
Связанные работы
HK Vojvodina — одна система для хоккейной школы
Весь клуб в одном месте: игроки, родители, тренеры, тренировки, оплаты, соревнования, статистика. Плюс публичный сайт.
that actually
ships.
OHM Agency — инженерная половина креативной студии
Долгое партнёрство с белградской креативной студией. Мы — инженерия, AI и внутренний тулинг, на котором держится ежедневная работа.
Журнал
Продолжить чтение
- teardown · 6 мин
Self-hosted Llama против Claude API: реальные цифры
Когда проблема в счёте за токены, а когда в GPU. Месячные цифры из живого агентства.
- essay · 5 мин
Инженерия как вторая половина креативной студии
Почему классическая передача от дизайна в разработку не работает, и как мы делаем иначе с OHM.
Мы готовы
Естьчтопостроить?
Расскажите, над чем работаете. Читаем каждое сообщение и отвечаем за рабочий день — с конкретным мнением и примерной суммой.