Тихонов Александр Станиславович

ML Engineer / AI Systems Engineer / LLM Agent Architect

Санкт-Петербург, РФ
GitHub: github.com/ascorblack
Telegram: @notsoulmate
Email: a@scorblack.ru
Website: ascorblack.ru/resume


Профессиональный профиль

ML Engineer / AI Systems Engineer с production-опытом в LLM-инфраструктуре, RAG-пайплайнах, semantic search, recommendation systems, highload backend и self-hosted AI-инфраструктуре. Работаю в полном цикле: архитектура, прототип, backend, деплой, мониторинг и эксплуатационные ограничения.

Ключевой фокус — практические AI-системы, которые можно разворачивать и эксплуатировать в реальной инфраструктуре: локальный inference, OpenAI-compatible backends, streaming, observability, orchestration policies, tool runtime, budgeting and safety controls.


Ключевые навыки

LLM / AI

  • LLM agent orchestration
  • RAG and retrieval pipelines
  • prompt engineering and token budget management
  • vLLM, local inference, Qwen 3 / Qwen 3.5
  • semantic search, reranking, intent classification
  • annotation audit and reproducible ML evaluation

Backend

  • Python 3.10-3.14
  • FastAPI, asyncio, aio-pika, aiohttp, httpx
  • SQLAlchemy, Pydantic v2
  • SSE streaming, JWT, API design
  • microservice architecture

Data and infrastructure

  • Elasticsearch: BM25 + vector search
  • Redis: caching, Pub/Sub, coordination
  • PostgreSQL, MariaDB, RabbitMQ
  • sentence-transformers, PyTorch, NumPy, SciPy
  • Docker, Docker Compose, Nginx, Linux, Git
  • Prometheus, Grafana, Elasticsearch/OpenSearch logging

Опыт работы

ООО «ЭБС ЛАНЬ» — ML Engineer / AI Systems Engineer

Санкт-Петербург · Январь 2024 — настоящее время

Проектирую и разрабатываю LLM-платформы, backend-сервисы и поисковую инфраструктуру. Основной профиль: production-ready AI-системы с асинхронной обработкой, поиском, очередями, потоковой отдачей ответов и интеграцией локальных моделей.

Я являюсь основным разработчиком AI-направления компании и работаю в полном цикле: архитектура, реализация, деплой, мониторинг и сопровождение.

LanGPT

Распределенный сервис генерации текста · 2024 — н.в. · Архитектор и основной разработчик backend

Production LLM-сервис, используемый студентами и преподавателями 20+ вузов. Система состоит из External API, Internal RAG Service и AI Distributor.

  • Разработал микросервисную архитектуру для внешнего API, внутренней оркестрации и балансировки LLM-бэкендов.
  • Реализовал JWT-аутентификацию, rate limiting и SSE-стриминг ответов через Redis Pub/Sub.
  • Построил RAG через Elasticsearch.
  • Реализовал адаптерный слой под OpenAI Chat Completions API и Responses API.
  • Добавил динамический реестр LLM-серверов без перезапуска сервиса.
  • Настроил мониторинг через Prometheus/Grafana и эксплуатационное логирование.

Стек: Python, FastAPI, RabbitMQ, Redis, Elasticsearch, PostgreSQL, MariaDB, aio-pika, aiohttp, httpx, Docker, Nginx, Prometheus.

Snippet Service

Поисковые сниппеты с LLM-генерацией · 2026 — н.в. · Архитектор и основной разработчик

Сервис генерации поисковых сниппетов в стиле Google/Яндекса по контенту ЭБС. Pipeline: Elasticsearch retrieval, context builder, chunking, BM25/cosine reranking, vLLM inference, Redis exact-match cache и semantic cache.

Целевой latency profile: менее 4s cold start и менее 100 ms при cache hit.

Стек: Python, FastAPI, vLLM, Elasticsearch, Redis, Docker, Nginx.

Рекомендательный сервис

Книга ↔ книга, видео ↔ книга, страница ↔ видео · 2024 — н.в.

  • Построил векторное профилирование книг и семантические рекомендации.
  • Реализовал индексацию YouTube-субтитров и поиск видео по содержанию книг.
  • Добавил рекомендации на уровне конкретных страниц книги.

Стек: Python, FastAPI, sentence-transformers, Elasticsearch, MariaDB, Docker.

Нейронный поисковый движок

2023-2024

  • Разработал гибридный поиск на BM25 и векторных эмбеддингах.
  • Собрал отдельные сервисы для классификации, векторизации, spellcheck и web API.
  • Участвовал в интеграции поиска в образовательные продукты, включая Moodle-плагин.

Стек: Python, FastAPI, PyTorch, sentence-transformers, Elasticsearch, PostgreSQL, Docker Compose, Nginx.

Дополнительные сервисы

  • Highload-сервис отписок от рассылки с RabbitMQ и PostgreSQL.
  • NLP-пайплайн извлечения и структурирования оглавлений из книг.
  • Сервис выделения терминов в книгах.

Собственные продукты и research artifacts

Protocore

AI-agent orchestration platform / protocol-first AI runtime

Protocore — beta-stage продуктовая AI-agent platform для бизнеса и разработчиков. Проект развивает protocol-first архитектуру для оркестрации AI-агентов, безопасный tool runtime, enterprise control plane, dashboard, chat interface, RBAC, observability, routing, budget controls and self-hosted deployment. На текущий момент внешних production-интеграций у Protocore нет; первая планируемая интеграция — внутри моей текущей компании.

Product page: protocore.ascorblack.ru/landing/index.html

Ключевые элементы:

  • multi-agent orchestration;
  • REST API + SSE streaming;
  • dashboard and chat UI;
  • OpenAI/Qwen/Llama/vLLM/Ollama-compatible backend layer;
  • tool runtime, approval gates and safety policies;
  • observability, run tracing, quotas and access plans;
  • deployment on own infrastructure.

swiftclf-tuna

Bilingual hierarchical intent classification for AI assistant routing

Research artifact по bilingual English/Russian hierarchical intent classification для AI assistant routing. Проект использует TUNA-derived 6-mode / 38-request-type taxonomy и исследует annotation ambiguity, calibration, language distribution shift and CPU-first deployment constraints.

Текущий consolidated baseline:

  • L1 accuracy: 0.849;
  • masked L2 macro F1: 0.7059 +/- 0.0037;
  • languages: English / Russian;
  • target deployment: CPU-first, GPU optional.

openai-api-bridge

Двусторонний адаптер между OpenAI Responses API и Chat Completions API. Поддерживает streaming, tool calling и reasoning-сценарии, позволяя использовать единый современный клиент поверх разных OpenAI-compatible backends.

AI Notes

Менеджер заметок с LLM-агентом, голосовым вводом, гибридным поиском и Markdown workspace.

Perplexity-Free

Open-source альтернатива Perplexity.ai: генерация поисковой стратегии через LLM, агрегация результатов через SearXNG, scraping content and Markdown report generation.


Образование

ИТМО

Бакалавриат · Прикладная математика и информатика · 2023 — н.в.

Текущий образовательный статус нужно подтвердить перед официальной подачей. В миграционном пакете основной акцент делается на commercial production experience and portfolio.


Языки

  • Русский: родной.
  • Английский: technical reading/writing; speaking in progress.