Парсер карточек Ozon, Avito, WB и Циан
Разработка устойчивого парсера карточек товаров и объявлений с маркетплейсов и классифайдов: сбор цен, атрибутов, медиа и геоданных. Обход антибот-защит, ротация прокси, нормализация и выгрузка в аналитический контур.
Задача
Заказчику нужен единый поток данных с Ozon, Wildberries, Avito и Циан: цены, атрибуты, медиа, геометки. Площадки меняют вёрстку и включают антибот — ручной сбор не масштабируется.
Подход
Собрали модульный парсер на Python и Playwright: ротация прокси, устойчивые селекторы, ретраи и нормализация схемы. Данные складываются в PostgreSQL и доступны аналитике через ETL-контур.
Результат
Один пайплайн закрывает несколько площадок. Команда ценообразования получает актуальные карточки без ручного копирования — с контролем качества и логами прогонов.
Единый пайплайн данных с нескольких площадок для ценообразования и аналитики