Парсинг сайта — это автоматизированный открытый сбор самых разнообразных информационных данных. Собранная информация систематизируется на основании одного, или нескольких принципов (пожеланий заказчика). Сбор информации осуществляется как в рамках глобальной компьютерной сети, так и на примере конкретного сайта, платформы, сервиса.

Важная поправка! Вся информация находится в открытом доступе для всех пользователей сети. Любой человек способен сам осуществить подобный сбор. Разница лишь в том, что робот-программа выполняет анализ, сбор и визуальное оформление за считанные секунды, минуты, часы. В то время, как человек на поиск может затрачивать дни, недели, месяцы. В некоторых случаях на ручной сбор информации может не хватить и целой жизни (все зависит от массива обрабатываемых данных).
Парсинг законен?

Если коротко, то сбор данных / парсинг сайта – вполне себе законное занятие, но с некоторыми замечаниями/оговорками. Систематизированный сбор информации из открытых источников является правомерным, если не нарушаются установленные законодательством запреты, то есть необходимо соблюдать действующий закон, который гласит, что НЕЛЬЗЯ. Почем?! Подробности в данном посте — Можно ли парсить сайт без разрешения?
Парсинг конкурентов
Данные парсинга, или что от нас получает Заказчик:
— список наименований продуктов/товаров/услуг;
— сегментация товаров/услуг/продуктов;
— подробные характеристики/описания интересующей заказчика продукции;

— все данные по текущей цене товара и ее изменение в динамике в будущем за определенный промежуток времени;

— наличие/отсутствие/запасы товара на складе;

— скидки, акции, распродажи на отдельно взятые продукты;

— появление новой товарной линейки (в случае ежемесячного мониторинга по подписке);

— отзывы/комментарии;

— ссылки на фотографии/видеоролики.