Да, экстракция информации может быть обнаружена владельцами веб-сайтов, но иногда это сделать достаточно трудно. Обнаружение можно свести к минимуму путем применения различных методик при извлечении данных, но наиболее частые способы его обнаружения довольно просты - например, метрики, выбивающиеся от средних, такие как IP-адреса, частота запросов страниц, количество запросов за любой заданный промежуток времени, местоположение и т. д. Поэтому, как только парсер запущен, например, с использованием 0,5-секундного интервала запроса страницы, веб-сайт обнаруживает, что, скорее всего, не человек загружает веб-страницу, так как это не соответствует поведению, которое вы ожидаете от реального посетителя, потребляющего содержимое страницы.