ZebroidДокументацияОбработка текстовУникализация текстов методом «Лапши»

Уникализация текстов методом «Лапши»

В программе: Обработка текстов → Уникализация текста методом «Лапши»
Суть этого метода уникализации в «переплетении» контента из нескольких независимых источников. Скажем Вы имеете в своём распоряжении контент взятый с большого автомобильного портала, блога автолюбителей, нескольких ЖЖешек и книгу про безопасное вождение. Ясно, что эти материалы концептуально близки друг другу и отлично подходят для перемешивания. Как только вы определились с источниками нового контента, вы загружаете их в проект сохраняя каждый источник в отдельной категории (не обязательно).

Затем задаёте размеры статей на выходе, отмечаете статьи которые необходимо использовать в качестве источников и способ формирования названий новым статьям. Запускаете процесс и программа обрабатывает статьи формируя новые, уникальные тексты. Читабельность таких текстов конечно будет желать лучшего, но в случае если вам необходимы уникальные тексты для сплогов, дорвеев или других проектов, для которых читабельность не основной параметр — способ прекрасно подойдет.


Инструмент перемешивания текстов статей


Итак разберемся с настройками:

  • Тип перемешивания — статьи перемешивать можно либо абзацами, либо предложениями, либо частями предложения (разделитель в стаком случае будет запятая, двоеточие и т.д.). В первом случае будет более читабельный текст, во втором — более уникальный
  • Перемешивание внутри статьи — способ перемешивания, при котором не создаются новые статьи, а просто текст статьи перемешивается (изменяется порядок следования предложений/абзацев/частей предложений). При использовании этого типа стоит иметь ввиду, что количество HTML оформления (заголовки, таблицы, списки, рисунки) должно быть сведено к минимуму (в идеале отсутствовать)
  • Способ распределения — определяет как будут вставляться блоки текста из разных источников. Если по очереди, тогда примерно по следующему алгоритму: первый блок (предложение или абзац) из первой статьи, второй блок из второй статьи, третий блок из третей статьи, дальше четвертый блок опять из первой статьи, пятый — из второй, шестой — из третей. Если же в разброс, тогда программа будет брать блоки в разном порядке, главное чтобы это было более-менее равномерно и без возможности вставить 2 блока подряд из одной и той же статьи
  • Способ выбора постов — определяет как будут выбираться статьи для перемешивания. Если выбрано из категорий, тогда программа для перемешивания берет все посты из разных категорий (количество категорий будет равна количество постов необходимых для перемешивания), если же все вместе, то тогда программа не смотрит на категории и выбирает посты в случайном порядке
  • Количество постов для перемешивания — со скольких постов программа будет делать новые (чем больше — тем уникальнее текст, но и тем он хуже читается)
  • Размер создаваемых статей — минимальное количество, при достижении которого программа будет сохранять статью и переходить к созданию следующей. Если параметр определен в блоках, тогда программа будет считать не символы, а блоки, которые использовала при создании статьи (блок — это предложение или абзац, зависит от настроек выше)
  • Новые статьи помещать в — имя категории, в которые программа будет сохранять статьи. Если категория не существует — Зеброид её создаст
  • Удалять после завершения — опция отвечает за необходимость удаления статей-источников по завершению проекта. Если выбрано «Использованные статьи» — то программа удалит только те статьи, из которых был получен хотя бы один блок для создания новой

Автоназвания — эти настройки отвечают за принцип создания названий новым статьям.