Как работает парсер email-адресов и когда его можно использовать

Юридические нюансы и технические особенности парсинга

Как использовать парсер email и можно ли

Для запуска любой email-рассылки необходима база подписчиков. Чтобы собрать электронные адреса, можно пойти стандартным путём — вовлекать аудиторию в общение, рассказывать о потенциальной пользе, собирать контакты в обмен на что-то ценное. Но есть и те, кто выбирает для решения этой задачи граббер email-адресов (парсер), который в кратчайшие сроки может собрать десятки тысяч контактов потенциальных подписчиков.

Парсер выглядит простым вариантом, но на деле все совсем непросто — особенно, если вы захотите собрать email-адреса.

Что такое парсинг

Представьте, что пользователь посещает различные сайты, копирует с них данные и сортирует их с учётом нужных критериев. Так работает парсинг, только вместо пользователей по сайтам ходят специальные роботы. Сервис-парсер обращается к страницам целевого сайта, получает HTML-код, ищет в нём нужные данные и сохраняет их в собственной базе.

Парсить можно самые разные данные. Например, можно собирать телефоны, прайсы, каталоги товаров, структуру сайтов и многое другое. В том числе можно парсить email-адреса. Для этого в настройках сервиса (или в скрипте) указывают параметры отслеживания — элементы, указывающие на электронный адрес («@», «email»). Как только парсер находит совпадения, он отправляет данные в базу. По итогам парсинга пользователь получает список, состоящий из URL сайтов и собранных email.

Преимущества парсинга очевидны:

  • сбор данных полностью автоматизирован;
  • параметры поиска можно настраивать;
  • можно собрать большой объём данных в кратчайшие сроки.

Применение парсинга выглядит очень удобным. Но вот с законностью есть проблемы.

Почему в большинстве случаев парсинг — не вариант

В ФЗ №149 «Об информации, информационных технологиях и о защите информации» сказано, что «к общедоступной информации относятся общеизвестные сведения и иная информация, доступ к которой не ограничен». Поскольку в большинстве случаев парсер собирает открытые данные, опубликованные в общем доступе, это не запрещено законом. Но есть нюансы. Парсинг признают легальным инструментом, если он не нарушает какой-либо закон. Рассмотрим, причиной каких нарушений может стать парсинг.

Незаконное обращение с персональными данными

Без разрешения владельца нельзя собирать, обрабатывать и использовать персональные данные. Причём не имеет значения то, что человек сам разместил свои данные в открытом доступе. Это не делает их общедоступными.

При парсинге бывает сложно определить, что можно считать персональными данными. По закону это любая информация, которая прямо или косвенно относится к определяемому физическому лицу. При этом не существуют унифицированного перечня видов данных. К персональной информации можно отнести любые сведения, которые позволяют идентифицировать человека, в том числе (в некоторых случаях — о них ниже) email.

Закон о персональных данных: правила хранения информации, штрафы за нарушения и изменения к 2026 году

Незаконный сбор, хранение, передача или продажа чужих персональных данных может привести не только к административной, но и к уголовной ответственности — вплоть до лишения свободы на срок до шести лет. Но и штрафы не маленькие: до 700 тыс. рублей.

Вывод

Нельзя парсить персональные данные.

Неправомерный доступ к компьютерной информации

Закон запрещает неправомерный доступ к информации, если это повлекло за собой уничтожение, блокировку, изменение или копирование сведений. Нарушителя могут оштрафовать, отправить на исправительные или принудительные работы или лишить свободы.

Даже если парсинг никак не влияет на контент, парсер в любом случае копирует информацию. Вопрос о правомерности доступа парсера к данным может быть спорным, ведь программы и скрипты по сути просто берут то, что им доступно. Однако даже в случае, если владелец сайта не озаботился достаточным уровнем защиты информации пользователей, получение неавторизованного доступа к ней может быть признано нарушением закона. К незаконным методам относится и обход технической блокировки парсинга.

При этом неграмотный парсинг может вызывать и перегрузку серверов, а это уже расценивается как DDoS-атака, за которую можно получить штраф до 200 тыс. рублей или уголовное наказание. Так сказано в ст. 272 УК РФ.

Вывод

Нельзя парсить данные, доступ к которым требует дополнительных действий со стороны пользователя. То есть, запрещено обходить блокировку парсинга, взламывать пароли, получать доступ к закрытым сведениям.

Использование гражданских прав для ограничения конкуренции

В законе есть такое понятие, как злоупотребление правом. Например, любой пользователь имеет право пользоваться общедоступной информацией, но только если это не вредит другим лицам. Кроме того, запрещено использовать гражданские права с целью навредить конкурентам.

Получается, что если парсинг причиняет вред конкурентам, это незаконно. Пострадавшее лицо может потребовать возместить убытки. К примеру, парсер собирает закрытые базы данных конкурирующих организаций, чтобы использовать их для обхода конкурентов.

Вывод

Нельзя использовать парсинг с целью навредить конкурентам или обрести доминирующее положение на рынке благодаря определённым сведениям.

Доступ к коммерческой тайне

Запрещено собирать сведения, которые составляют коммерческую тайну. За это могут оштрафовать, отправить на исправительные или принудительные работы и даже лишить свободы. При разглашении или использовании коммерческих сведений без согласия владельца наказание увеличивают.

Коммерческой тайной могут быть признаны разные типы информации, в том числе — списки и контакты клиентов и поставщиков. Основные критерии — ограниченный доступ и получение экономической выгоды от использования данных.

Сюда же можно отнести недобросовестную конкуренцию, которая связана с незаконным получением, использованием, разглашением информации, составляющей коммерческую или другую тайну. Т. е., если парсить данные конкурентов, можно нарушить статью 14.7 135-ФЗ.

Вывод

Запрещено применять парсинг для доступа к закрытой коммерческой информации, даже если впоследствии эта информация не будет использована.

Приведу несколько ситуаций, в которых парсинг не запрещен и может быть полезен владельцам сайтов и маркетологам:

  • Исследование рынка и анализ конкурентов. Например, чтобы узнать структуру сайта у компаний из вашей сферы.
  • Поиск ошибок на собственном ресурсе. Например, чтобы найти битые ссылки или цепочки редиректов.
  • Сбор семантики. Какие запросы популярны среди ваших клиентов? Какие страницы на сайте нужно внедрить?
  • Изучение контента. Например, чтобы узнать миссию и ценности других компаний из вашей ниши.

Можно ли парсить и использовать email-адреса

Получается, парсинг как инструмент законом не запрещён. Но имеет значение, что именно парсить и для каких целей.

Какие email-адреса можно парсить

Не всегда ясно, можно ли признать email-адреса персональной информацией. Сам по себе адрес электронной почты — это обезличенный набор букв и цифр. По нему сложно определить конкретного владельца. Например, mir1234@gmail.com или qwerty@mail.ru. Такие адреса нельзя считать персональными данными и, соответственно, их можно парсить.

А вот если вместе с теми же адресами парсят ФИО владельцев, то это уже незаконный сбор персональных данных. Пример: Иван Иванов — mir1234@gmail.com, Маша Петрова — qwerty@mail.ru.

Адреса электронной почты могут стать персональными данными, если в них есть информация, которая помогает идентифицировать человека: имя, фамилия, отчество, город проживания, год рождения. К примеру, olegsidorov@gmail.com, kotow15031994@yandex.ru. Парсинг таких адресов будет нарушением закона.

Ещё один нюанс в принадлежности email. В законе о персональных данных говорится о принадлежности информации физическому лицу. Соответственно, если электронный адрес принадлежит юридическому лицу, то он не признаётся персональной информацией.

Но и здесь исключение — парсить можно только общедоступные адреса. Если email-адрес юридического лица общедоступный (например, указан на официальном сайте компании), то его можно использовать для парсинга без получения согласия владельца данных.

Кстати, без согласия рассылать письма компаниям можно только через личную почту. Например, можно со своей почты отправить на корпоративную почту коммерческое предложение или запрос интересующей информации. Это называется email-аутрич. Но если делать это регулярно и большими объёмами, то легко попасть под спам-фильтры почтовых сервисов.

Вывод

Можно парсить email физических лиц, по которым невозможно идентифицировать владельцев. Также можно парсить электронные адреса компаний, опубликованные в открытом доступе.

Как использовать спарсенные email-адреса для рассылок

Независимо от того, можно ли считать адреса электронной почты персональными данными или нет, необходимо соблюдать правила обработки информации. Если захотите использовать email-адреса для создания базы подписчиков и запуска рассылки, нужно взять согласие владельцев.

Теоретически, это возможно: нужно сделать форму подписки на сайте, разослать по спарсенной базе ссылку на неё с предложением подписаться, и следующие письма отправлять по вновь собранной базе. Но эффективность будет нулевая: вряд ли кто-то согласится переходить по ссылке в письме от незнакомого бренда и оставлять свои контакты. А ещё такие письма будут уходить в спам. Кроме того, отправлять их через сервис рассылок не получится — только в частном порядке, а это долго и тоже рискованно.

Вывод

Использовать парсинг для легальных рассылок малоэффективно. Гораздо эффективнее применять законные способы сбора базы адресов. Например, через форму подписки на сайте либо предлагать подписку текущим клиентам.

Для чего ещё применяют спарсенные email

Списки спарсенных email можно применять для запуска рекламы. Например, можно настроить таргетинг на потенциальных клиентов в ВКонтакте и в сети MyTarget. Для этого список электронных адресов нужно загрузить в выбранную рекламную систему и настроить кампанию с нужными условиями.

Данный метод довольно популярен, поскольку позволяет быстро собрать аудиторию и запустить рекламную кампанию. При этом рекламные системы пока не могут проверять законность сбора email и относят этот этап к личной ответственности рекламодателя. Но в целом, такой способ использования спарсенных электронных адресов тоже нарушает закон. К тому же, таргетинг на незаинтересованных пользователей — это просто слив рекламного бюджета.

Программы и сервисы для парсинга

Hunter — Email Finder Extension. Расширение для браузера, которое умеет извлекать электронные адреса с сайтов. Также может собирать дополнительную информацию — имя, должность, профиль в соцсети, телефон.

Skrapp.io. Расширение браузера, которое ищет электронные адреса сотрудников B2B-компаний на сайтах и в Linkedin.

Email Extractor. Бесплатный сервис, который извлекает электронные адреса из загруженного текста объёмом до 100 тысяч символов.

Barkov.net. Сборщик email-адресов пользователей ВКонтакте.

Scrapebox Email Scraper. Сервис для парсинга email-адресов в разных поисковых системах, на разных сайтах и из локальных файлов. При экспорте можно сохранять URL-адрес, с которого получен email.

ZoomInfo. Собирает контактные данные B2B — номера телефонов, email-адреса, ссылки на профили в соцсетях. Дополнительно можно парсить и другие важные данные о клиентах и партнёрах — веб-упоминания, должностные обязанности  и иную информацию из публичного доступа.

Что в итоге

Сам по себе парсинг законом не запрещён. Но имеет значение, какие данные парсят и с какой целью. В частности, запрещено собирать email-адреса, если их можно признать персональными данными. Парсинг не запрещён, если объектом сбора выступают email-адреса компаний и организаций при условии отсутствия коммерческой тайны, вреда конкурентам и ограниченного доступа.

Спарсенные email-адреса нельзя использовать для запуска честной рассылки — владельцы не давали на это согласия.  Электронные адреса, собранные с помощью парсинга, нередко применяют для запуска таргетированной рекламы, но и это незаконно.

Парсинг можно применять для исследования рынка, анализа конкурентов, поиска ошибок на собственном ресурсе, сбора семантики, изучения контента. Но собирать электронные адреса лучше законными методами и только с согласия владельцев.

«Честно» — рассылка о том, что волнует и бесит

Искренние письма о работе и жизни, эксклюзивные кейсы и интервью с экспертами диджитала.

Наш юрист будет ругаться, если вы не примете :(
Готовая рассылка за 15 минут ⏰ ООО «Юнисендер СМАРТ», ИНН 9731091240, erid: 2VSb5yQvAY2