Генератор контента. Какие ваши мнения?
Здравствуйте. В общем, задумался над написанием генератора текста.
План работы:
1. Разбиваем текст по частям речи,
2. Разбиваем слова по семантике. Разбор по семантике будет проводиться более тонко (например, категория одежда, профессии и т.д.)
3. Далее получаем парадигмы всех слов.
4. Разбиваем все слова по падежам, родам, числам и т.д.
5. Создаем шаблоны предложений.
Теперь про кеи… Берем базу кеев разбиваем все эти словосочетания (именно словосочетания, а не отдельные слова, т.к. смысла нам нет брать ключевик и разбивать его на слова) по падежам…+ еще по каким либо параметрам (еще не определился).
Создаем шаблоны предложений, куда вставляются ключевики, т.е. я думаю, таким способом ключевики будут вставать на нужное место.
А уже в самом генераторе регулировать процент предложений с ключевыми словами.
Конечно, объем работы большой, решить это довольно просто, нанимаем негров….
Конечно, я описал принцип не так подробно как хотелось бы, но это пока еще мысли…
У кого какие мнения на эту тему? Хотелось бы послушать.
|