Тихонов Александр
Senior AI Systems Engineer / LLM Agent Architect
Санкт-Петербург, РФ
GitHub: github.com/ascorblack
Telegram: @notsoulmate
Email: a@scorblack.ru
О себе
Начал увлекаться сферой AI в 15 лет. В 2021 году победил в научно-практической конференции «Военмех — первый шаг в науку», где представил нейросеть для диагностики лёгочных заболеваний по рентгеновским снимкам. Модель была реализована с нуля на NumPy без свёрточных слоёв и показала точность 82.5%.
Сейчас специализируюсь на production-системах на базе LLM: агентная оркестрация, RAG-пайплайны, highload backend и self-hosted AI-инфраструктура. Обычно работаю полным циклом: от архитектуры и прототипа до деплоя, наблюдаемости и эксплуатационных ограничений.
Ключевые навыки
LLM / AI
- LLM agent orchestration
- RAG и retrieval pipelines
- multi-agent strategies: switching, parallel, division
- prompt engineering и token budget management
- vLLM, local inference, Qwen 3 / 3.5
- semantic search и reranking
Backend
- Python 3.10-3.14
- FastAPI, asyncio, aio-pika, aiohttp, httpx
- SQLAlchemy, Pydantic v2
- SSE streaming, JWT, Prometheus
Данные и инфраструктура
- Elasticsearch: BM25 + vector search
- Redis: caching, Pub/Sub, coordination
- PostgreSQL, MariaDB, RabbitMQ
- sentence-transformers, PyTorch, NumPy, Scipy
- Docker, Docker Compose, Nginx, Linux, Git
Опыт работы
ООО «ЭБС ЛАНЬ» — ML Engineer / AI Systems Engineer
Санкт-Петербург · Январь 2024 — настоящее время
Проектирую и разрабатываю LLM-платформы, backend-сервисы и поисковую инфраструктуру. Основной профиль: production-ready AI-системы с асинхронной обработкой, поиском, очередями, потоковой отдачей ответов и интеграцией локальных моделей.
Lan Agent Service
Мультиагентная LLM-платформа · 2026 — н.в. · Архитектор и основной разработчик
В разработке ...
Snippet-сервис
Поисковые сниппеты с LLM-генерацией · 2026 — н.в. · Архитектор и основной разработчик
В разработке ...
LanGPT
Распределённый сервис генерации текста · 2024 — н.в. · Архитектор и основной разработчик backend
- Разработал набор микросервисов для внешнего API, внутренней оркестрации и балансировки LLM-бэкендов.
- Реализовал JWT-аутентификацию, rate limiting и SSE-стриминг ответов.
- Построил адаптерный слой под OpenAI Chat Completions API и Responses API.
- Добавил динамический реестр LLM-серверов без перезапуска сервиса.
- Настроил мониторинг через Prometheus и эксплуатационное логирование.
Стек: Python, FastAPI, RabbitMQ, Redis, Elasticsearch, PostgreSQL, MariaDB, aio-pika, aiohttp, httpx, Docker, Nginx, Prometheus
Рекомендательный сервис
Книга ↔ книга, видео ↔ книга, страница ↔ книга · 2024 — н.в.
- Построил векторное профилирование книг и семантические рекомендации.
- Реализовал индексацию YouTube-субтитров и поиск видео по содержанию книг.
- Добавил рекомендации на уровне конкретных страниц книги.
Стек: Python, FastAPI, sentence-transformers, Elasticsearch, MariaDB, Docker
Нейронный поисковый движок
2023-2024
- Разработал гибридный поиск на BM25 и векторных эмбеддингах.
- Собрал отдельные сервисы для классификации, векторизации, spellcheck и web API.
- Участвовал в интеграции поиска в образовательные продукты, включая Moodle-плагин.
Стек: Python, FastAPI, PyTorch, sentence-transformers, Elasticsearch, PostgreSQL, Docker Compose, Nginx
Дополнительные сервисы
- Highload-сервис отписок от рассылки с RabbitMQ и PostgreSQL.
- Сервис извлечения оглавлений из книг.
- Сервис выделения терминов в книгах.
Open Source и личные проекты
Protocore Enterprise
Закрытая enterprise-ветка протокольно-ориентированного агентного runtime. Здесь развиваются service layer, enterprise control plane, dashboard, routing, secret management, live coordination, observability и production distribution для развёртывания полного AI runtime как продукта.
Protocore
Открытое protocol-first ядро для AI-агентов с предсказуемым orchestration loop, строгими контрактами, безопасным tool runtime и event-first observability. Используется как базовый публичный слой для идей, которые затем эволюционируют в enterprise-обвязке.
openai-api-bridge
Двусторонний адаптер между OpenAI Responses API и Chat Completions API. Поддерживает streaming, tool calling и reasoning-сценарии, позволяя использовать единый современный клиент поверх разных OpenAI-совместимых бэкендов.
AI Notes
Менеджер заметок с LLM-агентом, голосовым вводом, гибридным поиском и Markdown workspace.
Perplexity-Free
Опенсорсная альтернатива Perplexity.ai: генерация поисковой стратегии через LLM, агрегация результатов через SearXNG, скрапинг контента и сохранение итоговых отчётов в Markdown.
Образование
ИТМО
Бакалавриат · Прикладная математика и информатика · 2023 — н.в.
Технологический стек
- Python 3.14, FastAPI, asyncio
- LLM Agents, RAG, vLLM, Qwen 3 / 3.5
- RabbitMQ, Redis, Elasticsearch, PostgreSQL
- Docker, Nginx, Prometheus