Тихонов Александр

Senior AI Systems Engineer / LLM Agent Architect

Санкт-Петербург, РФ
GitHub: github.com/ascorblack
Telegram: @notsoulmate
Email: a@scorblack.ru

О себе

Начал увлекаться сферой AI в 15 лет. В 2021 году победил в научно-практической конференции «Военмех — первый шаг в науку», где представил нейросеть для диагностики лёгочных заболеваний по рентгеновским снимкам. Модель была реализована с нуля на NumPy без свёрточных слоёв и показала точность 82.5%.

Сейчас специализируюсь на production-системах на базе LLM: агентная оркестрация, RAG-пайплайны, highload backend и self-hosted AI-инфраструктура. Обычно работаю полным циклом: от архитектуры и прототипа до деплоя, наблюдаемости и эксплуатационных ограничений.

Ключевые навыки

LLM / AI

LLM agent orchestration
RAG и retrieval pipelines
multi-agent strategies: switching, parallel, division
prompt engineering и token budget management
vLLM, local inference, Qwen 3 / 3.5
semantic search и reranking

Backend

Python 3.10-3.14
FastAPI, asyncio, aio-pika, aiohttp, httpx
SQLAlchemy, Pydantic v2
SSE streaming, JWT, Prometheus

Данные и инфраструктура

Elasticsearch: BM25 + vector search
Redis: caching, Pub/Sub, coordination
PostgreSQL, MariaDB, RabbitMQ
sentence-transformers, PyTorch, NumPy, Scipy
Docker, Docker Compose, Nginx, Linux, Git

Опыт работы

ООО «ЭБС ЛАНЬ» — ML Engineer / AI Systems Engineer

Санкт-Петербург · Январь 2024 — настоящее время

Проектирую и разрабатываю LLM-платформы, backend-сервисы и поисковую инфраструктуру. Основной профиль: production-ready AI-системы с асинхронной обработкой, поиском, очередями, потоковой отдачей ответов и интеграцией локальных моделей.

Lan Agent Service

Мультиагентная LLM-платформа · 2026 — н.в. · Архитектор и основной разработчик

В разработке ...

Snippet-сервис

Поисковые сниппеты с LLM-генерацией · 2026 — н.в. · Архитектор и основной разработчик

В разработке ...

LanGPT

Распределённый сервис генерации текста · 2024 — н.в. · Архитектор и основной разработчик backend

Разработал набор микросервисов для внешнего API, внутренней оркестрации и балансировки LLM-бэкендов.
Реализовал JWT-аутентификацию, rate limiting и SSE-стриминг ответов.
Построил адаптерный слой под OpenAI Chat Completions API и Responses API.
Добавил динамический реестр LLM-серверов без перезапуска сервиса.
Настроил мониторинг через Prometheus и эксплуатационное логирование.

Стек: Python, FastAPI, RabbitMQ, Redis, Elasticsearch, PostgreSQL, MariaDB, aio-pika, aiohttp, httpx, Docker, Nginx, Prometheus

Нейронный поисковый движок

2023-2024

Разработал гибридный поиск на BM25 и векторных эмбеддингах.
Собрал отдельные сервисы для классификации, векторизации, spellcheck и web API.
Участвовал в интеграции поиска в образовательные продукты, включая Moodle-плагин.

Стек: Python, FastAPI, PyTorch, sentence-transformers, Elasticsearch, PostgreSQL, Docker Compose, Nginx

Дополнительные сервисы

Highload-сервис отписок от рассылки с RabbitMQ и PostgreSQL.
Сервис извлечения оглавлений из книг.
Сервис выделения терминов в книгах.

Open Source и личные проекты

Protocore Enterprise

Закрытая enterprise-ветка протокольно-ориентированного агентного runtime. Здесь развиваются service layer, enterprise control plane, dashboard, routing, secret management, live coordination, observability и production distribution для развёртывания полного AI runtime как продукта.

Protocore

Открытое protocol-first ядро для AI-агентов с предсказуемым orchestration loop, строгими контрактами, безопасным tool runtime и event-first observability. Используется как базовый публичный слой для идей, которые затем эволюционируют в enterprise-обвязке.

openai-api-bridge

Двусторонний адаптер между OpenAI Responses API и Chat Completions API. Поддерживает streaming, tool calling и reasoning-сценарии, позволяя использовать единый современный клиент поверх разных OpenAI-совместимых бэкендов.

AI Notes

Менеджер заметок с LLM-агентом, голосовым вводом, гибридным поиском и Markdown workspace.

Perplexity-Free

Опенсорсная альтернатива Perplexity.ai: генерация поисковой стратегии через LLM, агрегация результатов через SearXNG, скрапинг контента и сохранение итоговых отчётов в Markdown.

Образование

ИТМО

Бакалавриат · Прикладная математика и информатика · 2023 — н.в.

Технологический стек

Python 3.14, FastAPI, asyncio
LLM Agents, RAG, vLLM, Qwen 3 / 3.5
RabbitMQ, Redis, Elasticsearch, PostgreSQL
Docker, Nginx, Prometheus

Резюме