Цитата:
Сообщение от Artem
я так понял что все проблемы доров есть ТЕКСТ. То есть дор от ЛЮБОГО объекта в сети отличается только одним - текстом. То есть в идеаль мне нужно нанять программиста что бы он написал генератор текста на основе высшей математики и огромного кол-ва теоретики в плане морфологии, а доргены, тдс и тп проблемы это все бред, который решается очень просто?
|
Есть готовый морфологический анализатор Mystem от самого яндекса. Прекрасно работает в связке с php. Есть phpmorphy с шикарными библиотеками.
Несложно реализовать такое:
1). На входе имеем ключевую фразу. Анализируем морфологию. Получаем фразу во всех падежах.
2). На входе имеем кусок текстовки. Анализируем. Определяем слова, которые можно заменить нашей фразой. Заменяем в соответствующем падеже, не забывая контролировать плотность.
На выходе текст вполне приличного качества. Это очень утрированно, но мыслей по каждому этапу есть много. Есть и кое-какие наработки.
Кто хочет пообщаться на эту тему с прицелом на реализацию прошу в личку.