Парсинг сообществ во Вконтакте

Иногда приходится работать с поиском сообществ для таргетинга во Вконтакте. Так как задачи разовые, а платить за подписку на ТаргетХантер или Церебро не хочется, то можно сделать свою подборку. Я использую связку операторов поиска для Google и дополнение для Google Chrome.

Задача

Собрать страницы ресторанов по Санкт-Петербургу во Вконтакте.

Решение

Парсинг результатов поиска Google при помощи операторов:
ключевая фраза + уточнение + сайт + период

Ресторан Санкт-Петербург Откроется site:vk.com after:2021-01-01

В поисковой фразе указывает тип или категорию поиска. В нашем случае это рестораны и гео уточнение. Также указываем дополнительное слово «Откроется» — это позволит собрать только заполненные и актуальные сообщества. В 90% такие страницы ведут и наполняют актуальной информацией.

Метод разовый и не подразумевает постоянное использование. При этом сообщества 100% будут соответствовать оператору after. Гугл соберет только обновляющиеся страницы, которые публиковали посты в заданном диапазоне.

Добавляем оператор site. Это значит, что все результаты будут из домена vk.com. В конце добавляем оператор after, чтобы собрать все страницы, которые обновлялись после опеределенной даты. Это необходимо, чтобы было больше актуальных результатов в списке.

пример работы поисковых операторов Google after и site
Демонстрация операторов Google

Парсинг

Теперь весь список сообществ нужно спарсить из результатов поисковой выдачи Google. Для этого мы будем использовать экстеншен Data Miner. ОН позволяет настроить нужный формат результатов и быстро их выгрузить.

пример работы дополнения Data Miner в поиске Google
Демонстрация работы Data Miner

Для работы в нем понадобится выбрать готовый шаблон работы с данными Google Search Results – Get All Links 2021, а также указать какое количество страниц грабить. По умолчанию он собирает данные первых десяти результатов. Я рекомендую парсить не более 10 страниц, потому что там дальше собирается всякий шлак.

Указываем число 10 в Number of Page to Scrape

После настроек жмем Scrape 10 Pages и ждем пока результаты подготовятся. Дело в том, что приложение сканирует каждую страницу и собирает результаты в общую таблицу.

результаты парсинга сообществ Вконтакте из поисковой выдачи Google

Теперь можно скопировать результаты в буфер обмена или скачать в CSV/Exel. Далее загружаем список сообществ в рекламную кампанию во Вконтакте. Обратите внимание, что в моем списке 361 строка, а в ВК можно залить только 200 результатов.

импорт списка сообществ в объявление во Вконтакте
Демонстрация загрузки сообществ в объявление во Вконтакте

Недостатки

Процесс небыстрый, а занимает 10-15 минут при условии, что ты помнишь этапы процесса. Я для этого всегда использую готовые текстовые шорткаты, что существенно экономит время на вспоминание последовательности оператора.

Результаты неточные. Да, будут попадаться фейковые аккаунты или страницы с обсуждениями, но их доля настолько мала, что это несущественно.

Send
Share
Pin