1. Подготовка контента.
Текст можно достать из многих источников и с помощью различных программ. Одна из самых удобных это Contend Downloader. Именно так я и делал в начале, но это довольно трудоемко, так как необходимо под каждый сайт создавать отдельный шаблон для парсинга. Буквально в тот же день на форуме нулледа был выложен скрипт парсящий контент по ключевым словам с выдачи. Что-то типа Seodora или SED. Ссылка на топик — тыц.
Скрипт выложен под хайдом 100, поэтому в общий доступ его не выкладываю. Но Вы всегда можете постучать к автору и договориться за скрипт.