← Все работы

Парсинг · 2026

Парсер карточек Ozon, Avito, WB и Циан

Разработка устойчивого парсера карточек товаров и объявлений с маркетплейсов и классифайдов: сбор цен, атрибутов, медиа и геоданных. Обход антибот-защит, ротация прокси, нормализация и выгрузка в аналитический контур.

PythonPlaywrightПроксиETLPostgreSQL

Задача

Заказчику нужен единый поток данных с Ozon, Wildberries, Avito и Циан: цены, атрибуты, медиа, геометки. Площадки меняют вёрстку и включают антибот — ручной сбор не масштабируется.

Подход

Собрали модульный парсер на Python и Playwright: ротация прокси, устойчивые селекторы, ретраи и нормализация схемы. Данные складываются в PostgreSQL и доступны аналитике через ETL-контур.

Результат

Один пайплайн закрывает несколько площадок. Команда ценообразования получает актуальные карточки без ручного копирования — с контролем качества и логами прогонов.

Результат

Единый пайплайн данных с нескольких площадок для ценообразования и аналитики

Контакт

Обсудим
похожую задачу

Опишите контекст — ответим с оценкой подхода и сроков