Тихонов Александр

Senior AI Systems Engineer / LLM Agent Architect

Санкт-Петербург, РФ
GitHub: github.com/ascorblack
Telegram: @notsoulmate
Email: a@scorblack.ru


О себе

Начал увлекаться сферой AI в 15 лет. В 2021 году победил в научно-практической конференции «Военмех — первый шаг в науку», где представил нейросеть для диагностики лёгочных заболеваний по рентгеновским снимкам. Модель была реализована с нуля на NumPy без свёрточных слоёв и показала точность 82.5%.

Сейчас специализируюсь на production-системах на базе LLM: агентная оркестрация, RAG-пайплайны, highload backend и self-hosted AI-инфраструктура. Обычно работаю полным циклом: от архитектуры и прототипа до деплоя, наблюдаемости и эксплуатационных ограничений.


Ключевые навыки

LLM / AI

  • LLM agent orchestration
  • RAG и retrieval pipelines
  • multi-agent strategies: switching, parallel, division
  • prompt engineering и token budget management
  • vLLM, local inference, Qwen 3 / 3.5
  • semantic search и reranking

Backend

  • Python 3.10-3.14
  • FastAPI, asyncio, aio-pika, aiohttp, httpx
  • SQLAlchemy, Pydantic v2
  • SSE streaming, JWT, Prometheus

Данные и инфраструктура

  • Elasticsearch: BM25 + vector search
  • Redis: caching, Pub/Sub, coordination
  • PostgreSQL, MariaDB, RabbitMQ
  • sentence-transformers, PyTorch, NumPy, Scipy
  • Docker, Docker Compose, Nginx, Linux, Git

Опыт работы

ООО «ЭБС ЛАНЬ» — ML Engineer / AI Systems Engineer

Санкт-Петербург · Январь 2024 — настоящее время

Проектирую и разрабатываю LLM-платформы, backend-сервисы и поисковую инфраструктуру. Основной профиль: production-ready AI-системы с асинхронной обработкой, поиском, очередями, потоковой отдачей ответов и интеграцией локальных моделей.

Lan Agent Service

Мультиагентная LLM-платформа · 2026 — н.в. · Архитектор и основной разработчик

В разработке ...

Snippet-сервис

Поисковые сниппеты с LLM-генерацией · 2026 — н.в. · Архитектор и основной разработчик

В разработке ...

LanGPT

Распределённый сервис генерации текста · 2024 — н.в. · Архитектор и основной разработчик backend

  • Разработал набор микросервисов для внешнего API, внутренней оркестрации и балансировки LLM-бэкендов.
  • Реализовал JWT-аутентификацию, rate limiting и SSE-стриминг ответов.
  • Построил адаптерный слой под OpenAI Chat Completions API и Responses API.
  • Добавил динамический реестр LLM-серверов без перезапуска сервиса.
  • Настроил мониторинг через Prometheus и эксплуатационное логирование.

Стек: Python, FastAPI, RabbitMQ, Redis, Elasticsearch, PostgreSQL, MariaDB, aio-pika, aiohttp, httpx, Docker, Nginx, Prometheus

Рекомендательный сервис

Книга ↔ книга, видео ↔ книга, страница ↔ книга · 2024 — н.в.

  • Построил векторное профилирование книг и семантические рекомендации.
  • Реализовал индексацию YouTube-субтитров и поиск видео по содержанию книг.
  • Добавил рекомендации на уровне конкретных страниц книги.

Стек: Python, FastAPI, sentence-transformers, Elasticsearch, MariaDB, Docker

Нейронный поисковый движок

2023-2024

  • Разработал гибридный поиск на BM25 и векторных эмбеддингах.
  • Собрал отдельные сервисы для классификации, векторизации, spellcheck и web API.
  • Участвовал в интеграции поиска в образовательные продукты, включая Moodle-плагин.

Стек: Python, FastAPI, PyTorch, sentence-transformers, Elasticsearch, PostgreSQL, Docker Compose, Nginx

Дополнительные сервисы

  • Highload-сервис отписок от рассылки с RabbitMQ и PostgreSQL.
  • Сервис извлечения оглавлений из книг.
  • Сервис выделения терминов в книгах.

Open Source и личные проекты

Protocore Enterprise

Закрытая enterprise-ветка протокольно-ориентированного агентного runtime. Здесь развиваются service layer, enterprise control plane, dashboard, routing, secret management, live coordination, observability и production distribution для развёртывания полного AI runtime как продукта.

Protocore

Открытое protocol-first ядро для AI-агентов с предсказуемым orchestration loop, строгими контрактами, безопасным tool runtime и event-first observability. Используется как базовый публичный слой для идей, которые затем эволюционируют в enterprise-обвязке.

openai-api-bridge

Двусторонний адаптер между OpenAI Responses API и Chat Completions API. Поддерживает streaming, tool calling и reasoning-сценарии, позволяя использовать единый современный клиент поверх разных OpenAI-совместимых бэкендов.

AI Notes

Менеджер заметок с LLM-агентом, голосовым вводом, гибридным поиском и Markdown workspace.

Perplexity-Free

Опенсорсная альтернатива Perplexity.ai: генерация поисковой стратегии через LLM, агрегация результатов через SearXNG, скрапинг контента и сохранение итоговых отчётов в Markdown.


Образование

ИТМО

Бакалавриат · Прикладная математика и информатика · 2023 — н.в.


Технологический стек

  • Python 3.14, FastAPI, asyncio
  • LLM Agents, RAG, vLLM, Qwen 3 / 3.5
  • RabbitMQ, Redis, Elasticsearch, PostgreSQL
  • Docker, Nginx, Prometheus