Тихонов Александр Станиславович
ML Engineer / AI Systems Engineer / LLM Agent Architect
Санкт-Петербург, РФ
GitHub: github.com/ascorblack
Telegram: @notsoulmate
Email: a@scorblack.ru
Website: ascorblack.ru/resume
Профессиональный профиль
ML Engineer / AI Systems Engineer с production-опытом в LLM-инфраструктуре, RAG-пайплайнах, semantic search, recommendation systems, highload backend и self-hosted AI-инфраструктуре. Работаю в полном цикле: архитектура, прототип, backend, деплой, мониторинг и эксплуатационные ограничения.
Ключевой фокус — практические AI-системы, которые можно разворачивать и эксплуатировать в реальной инфраструктуре: локальный inference, OpenAI-compatible backends, streaming, observability, orchestration policies, tool runtime, budgeting and safety controls.
Ключевые навыки
LLM / AI
- LLM agent orchestration
- RAG and retrieval pipelines
- prompt engineering and token budget management
- vLLM, local inference, Qwen 3 / Qwen 3.5
- semantic search, reranking, intent classification
- annotation audit and reproducible ML evaluation
Backend
- Python 3.10-3.14
- FastAPI, asyncio, aio-pika, aiohttp, httpx
- SQLAlchemy, Pydantic v2
- SSE streaming, JWT, API design
- microservice architecture
Data and infrastructure
- Elasticsearch: BM25 + vector search
- Redis: caching, Pub/Sub, coordination
- PostgreSQL, MariaDB, RabbitMQ
- sentence-transformers, PyTorch, NumPy, SciPy
- Docker, Docker Compose, Nginx, Linux, Git
- Prometheus, Grafana, Elasticsearch/OpenSearch logging
Опыт работы
ООО «ЭБС ЛАНЬ» — ML Engineer / AI Systems Engineer
Санкт-Петербург · Январь 2024 — настоящее время
Проектирую и разрабатываю LLM-платформы, backend-сервисы и поисковую инфраструктуру. Основной профиль: production-ready AI-системы с асинхронной обработкой, поиском, очередями, потоковой отдачей ответов и интеграцией локальных моделей.
Я являюсь основным разработчиком AI-направления компании и работаю в полном цикле: архитектура, реализация, деплой, мониторинг и сопровождение.
LanGPT
Распределенный сервис генерации текста · 2024 — н.в. · Архитектор и основной разработчик backend
Production LLM-сервис, используемый студентами и преподавателями 20+ вузов. Система состоит из External API, Internal RAG Service и AI Distributor.
- Разработал микросервисную архитектуру для внешнего API, внутренней оркестрации и балансировки LLM-бэкендов.
- Реализовал JWT-аутентификацию, rate limiting и SSE-стриминг ответов через Redis Pub/Sub.
- Построил RAG через Elasticsearch.
- Реализовал адаптерный слой под OpenAI Chat Completions API и Responses API.
- Добавил динамический реестр LLM-серверов без перезапуска сервиса.
- Настроил мониторинг через Prometheus/Grafana и эксплуатационное логирование.
Стек: Python, FastAPI, RabbitMQ, Redis, Elasticsearch, PostgreSQL, MariaDB, aio-pika, aiohttp, httpx, Docker, Nginx, Prometheus.
Snippet Service
Поисковые сниппеты с LLM-генерацией · 2026 — н.в. · Архитектор и основной разработчик
Сервис генерации поисковых сниппетов в стиле Google/Яндекса по контенту ЭБС. Pipeline: Elasticsearch retrieval, context builder, chunking, BM25/cosine reranking, vLLM inference, Redis exact-match cache и semantic cache.
Целевой latency profile: менее 4s cold start и менее 100 ms при cache hit.
Стек: Python, FastAPI, vLLM, Elasticsearch, Redis, Docker, Nginx.
Рекомендательный сервис
Книга ↔ книга, видео ↔ книга, страница ↔ видео · 2024 — н.в.
- Построил векторное профилирование книг и семантические рекомендации.
- Реализовал индексацию YouTube-субтитров и поиск видео по содержанию книг.
- Добавил рекомендации на уровне конкретных страниц книги.
Стек: Python, FastAPI, sentence-transformers, Elasticsearch, MariaDB, Docker.
Нейронный поисковый движок
2023-2024
- Разработал гибридный поиск на BM25 и векторных эмбеддингах.
- Собрал отдельные сервисы для классификации, векторизации, spellcheck и web API.
- Участвовал в интеграции поиска в образовательные продукты, включая Moodle-плагин.
Стек: Python, FastAPI, PyTorch, sentence-transformers, Elasticsearch, PostgreSQL, Docker Compose, Nginx.
Дополнительные сервисы
- Highload-сервис отписок от рассылки с RabbitMQ и PostgreSQL.
- NLP-пайплайн извлечения и структурирования оглавлений из книг.
- Сервис выделения терминов в книгах.
Собственные продукты и research artifacts
Protocore
AI-agent orchestration platform / protocol-first AI runtime
Protocore — beta-stage продуктовая AI-agent platform для бизнеса и разработчиков. Проект развивает protocol-first архитектуру для оркестрации AI-агентов, безопасный tool runtime, enterprise control plane, dashboard, chat interface, RBAC, observability, routing, budget controls and self-hosted deployment. На текущий момент внешних production-интеграций у Protocore нет; первая планируемая интеграция — внутри моей текущей компании.
Product page: protocore.ascorblack.ru/landing/index.html
Ключевые элементы:
- multi-agent orchestration;
- REST API + SSE streaming;
- dashboard and chat UI;
- OpenAI/Qwen/Llama/vLLM/Ollama-compatible backend layer;
- tool runtime, approval gates and safety policies;
- observability, run tracing, quotas and access plans;
- deployment on own infrastructure.
swiftclf-tuna
Bilingual hierarchical intent classification for AI assistant routing
Research artifact по bilingual English/Russian hierarchical intent classification для AI assistant routing. Проект использует TUNA-derived 6-mode / 38-request-type taxonomy и исследует annotation ambiguity, calibration, language distribution shift and CPU-first deployment constraints.
Текущий consolidated baseline:
- L1 accuracy: 0.849;
- masked L2 macro F1: 0.7059 +/- 0.0037;
- languages: English / Russian;
- target deployment: CPU-first, GPU optional.
openai-api-bridge
Двусторонний адаптер между OpenAI Responses API и Chat Completions API. Поддерживает streaming, tool calling и reasoning-сценарии, позволяя использовать единый современный клиент поверх разных OpenAI-compatible backends.
AI Notes
Менеджер заметок с LLM-агентом, голосовым вводом, гибридным поиском и Markdown workspace.
Perplexity-Free
Open-source альтернатива Perplexity.ai: генерация поисковой стратегии через LLM, агрегация результатов через SearXNG, scraping content and Markdown report generation.
Образование
ИТМО
Бакалавриат · Прикладная математика и информатика · 2023 — н.в.
Текущий образовательный статус нужно подтвердить перед официальной подачей. В миграционном пакете основной акцент делается на commercial production experience and portfolio.
Языки
- Русский: родной.
- Английский: technical reading/writing; speaking in progress.