ZebroidСтатьиЛегкий способ по добыче контента

Легкий способ по добыче контента

Здравствуйте! Нередко для пользователей Зеброида стоит вопрос о больших объемах контента. Предлагаю один из способов решения.
Мы будем вытаскивать полные статьи из rss-фида с помощью данного продукта.
Для этого вводим в строке поиска Google запрос типа: «Full-Text RSS 3.6: Compatibility Test».

Пробегаемся по выдаче. Важно, чтобы требуемые разработчиком технические характеристики совпадали с возможностями серверов, на которых установлен данный скрипт. К примеру, на этом сайте все требования соблюдены.
Переходим на главную страницу скрипта и настраиваем его:

  • Напротив «Max items» вводим 30 (используем предоставленный нам лимит). Скрипт будет выдергивать 30 полных статей.
  • Напротив «Links» выбираем «remove». Скрипт будет удалять ссылки из статей.
  • Напротив «If extraction fails» выбираем «remove item from feed». Скрипт будет пропускать статьи, где не удалось выдернуть контент полностью.
С поиском RSS-фида заморачиваться также не будем и воспользуемся сервисом google Alerts.

Ну тут, я думаю, пояснять не нужно. Наверное уже все сталкивались с этим сервисом.
После создания RSS-фида копируем ссылку на него. И скармливаем эту ссылку нашему скрипту. Вот что в итоге получается:

Из адресной строки копируем ссылку. Мы ее будем в дальнейшем использовать в зеброиде. Открываем Зеброид. Выбираем «Проект — Импорт — RSS Импорт».

Вводим наш URL-ленты и запускаем процесс.
Затем нам надо сделать небольшие правки. Для этого выбираем «Обработка текстов — Замена». И создаем 3 правила:

Применяем эти три правила.
Теперь нам нужно удалить ненужные тэги. Выбираем «Плагины — Работа с текстом — HTML Cleaner».

Указываем тэги, которые мы хотим оставить и запускаем процесс.
Также неплохо было бы немного уникализировать добытый контент. Для этого выбираем «Обработка текстов — Синонимайзер».

Указываем процент и запускаем процесс.
Ну вот вроде бы и все!

Ну а дальше используйте этот контент по своему усмотрению. Надеюсь, что кому-то помог. Спасибо за внимание!

Метки:

rapcorerapcore 21 ноября 2016, 23:12

3 комментария

  • avatar

    21 ноября 2016, 23:50

    Privatnic
    Спасибо за кейсы!
  • avatar

    22 ноября 2016, 18:33

    rapcore
    Я рад, что пригодилось!
  • avatar

    23 ноября 2016, 00:09

    ruslanz
    Благодарю rapcore , за подробный полезный кейс
Только зарегистрированные и авторизованные пользователи могут оставлять комментарии.

Популярные метки

cms Facebook FTP RSS SSH themeforest ucoz wordpress xml-rpc Zebroid автонаполнение автопостинг акция видео википедия вконтакте заливка Зеброид импорт инструменты капля-макрос картинки карты Ключи в тексте Метки настройки обновление обработка оригинальные тексты парсинг переводчик перелинковка плагины постинг похожие статьи программа проект прокси редактор сайт сателлит скидка скидки содержание социальные сети тексты уникализация форум экспорт Яндекс api CSS CSV Excel SQL updater Word XML XSL аккаунты быстрый старт горячие клавиши дерево проекта дополнительные поля каптча категории ключевые слова командная строка комментарии меню новичкам орфография планировщик поиск профили публикация регулярные выражения скачивание скрипты словари ссылки статья типы проектов транслитерация установка файлы чистка