ArbаDoor.ru - форум о дорвеях

Вернуться   Форум о дорвеях > Флудилка

Ответ
 
Опции темы
Старый 03.08.2009, 23:21   #1
 
Регистрация: 01.08.2009
Сообщений: 58
Отправить сообщение для Палево-Шмалево с помощью ICQ


По умолчаниюНаписать свой генератор текста

Здавствуйте, всем. Такое дело: есть боль�?ое желание написать свой генератор текста. �?менно генератор. Чтоб придумывал предложения в соответствии с правилами русс. языка. Ну, или почти в соответствии. Чтобы получались вполне согласованные читаемые предложения. Для начала. В идеале - чтоб сохранялся смысл не только в пределах предложения, но, по мень�?ей мере, в абзаце/статье. Т.е. на одну тему.
Мои варианты реализации:
1. Парсим словари, набираем базу слов(прилаг,сущ, глаг, и т.д.), по исходным формам создаем базу возможных вариантов употребления, составляем �?аблоны (долго).
2. Пи�?ем своеобразный распознаватель частей речи и их форм, он же - анализатор �?аблонов предложений. На базе проанализированного текста создаем свой. С набором статистических данных качество текстов сильно улуч�?ится (перспективно).
Что думаете на этот счет? Может еще есть идеи?
Палево-Шмалево вне форума 
Ответить с цитированием
Старый 03.08.2009, 23:49   #2
 
Регистрация: 16.07.2009
Адрес: На югах
Сообщений: 25


По умолчанию

Еще стихи можно писать...
__________________
Всё вокруг - заговор, направленный против меня одного.
SmItHrIx вне форума 
Ответить с цитированием
Старый 03.08.2009, 23:55   #3
 
Регистрация: 01.08.2009
Сообщений: 58
Отправить сообщение для Палево-Шмалево с помощью ICQ


По умолчанию

Можно! �? рисовать и скульптуры делать... и все на автомате.
Палево-Шмалево вне форума 
Ответить с цитированием
Старый 04.08.2009, 00:04   #4
 
Регистрация: 16.07.2009
Адрес: На югах
Сообщений: 25


По умолчанию

Пол года назад, я трое или четверо суток убил на второй вариант. В итоге яндекс эту хуйню так и не сожрал. Если все же хочется написать генератор контента, то предлагаю посмотреть на парсинг>синонимайзинг>заме на слов на ключи с похожей структурой. Так текст будет довольно читаем и иметь нормальную уникальность. �?МХО
__________________
Всё вокруг - заговор, направленный против меня одного.
SmItHrIx вне форума 
Ответить с цитированием
Старый 04.08.2009, 00:30   #5
 
Регистрация: 01.08.2009
Сообщений: 58
Отправить сообщение для Палево-Шмалево с помощью ICQ


По умолчанию

Цитата:
Сообщение от SmItHrIx
Пол года назад, я трое или четверо суток убил на второй вариант. В итоге яндекс эту хуйню так и не сожрал. Если все же хочется написать генератор контента, то предлагаю посмотреть на парсинг>синонимайзинг>заме на слов на ключи с похожей структурой. Так текст будет довольно читаем и иметь нормальную уникальность. �?МХО
и насколько текст получился человеческим? правила языка соблюдались? видимо, не до конца доработал или косяки были серьезные, не обратил внимания. В первый эксперимент, результат обычно никакой... Чего не продолжил дело?
Палево-Шмалево вне форума 
Ответить с цитированием
Старый 04.08.2009, 00:54   #6
 
Регистрация: 16.07.2009
Адрес: На югах
Сообщений: 25


По умолчанию

Цитата:
Сообщение от Палево-Шмалево
и насколько текст получился человеческим? правила языка соблюдались?
Выглядел красиво, все как задумывалось. Но вот только текст по смыслу получался бредовее чем от марковки.


Цитата:
Сообщение от Палево-Шмалево
Чего не продолжил дело?
Я через 2 недели исходник открыл и охуел. Проще с нуля написать.
__________________
Всё вокруг - заговор, направленный против меня одного.
SmItHrIx вне форума 
Ответить с цитированием
Старый 04.08.2009, 01:33   #7
 
Регистрация: 05.07.2009
Сообщений: 23


По умолчанию

Зачем писать второй RedButton VVS?
fromnull вне форума 
Ответить с цитированием
Старый 04.08.2009, 13:55   #8
 
Регистрация: 06.07.2009
Сообщений: 24


По умолчанию

Цитата:
Сообщение от Палево-Шмалево
Здавствуйте, всем. Такое дело: есть боль�?ое желание написать свой генератор текста. �?менно генератор. Чтоб придумывал предложения в соответствии с правилами русс. языка.
...
Что думаете на этот счет? Может еще есть идеи?
Во-первых, уже есть ред баттон ввс.
Во-вторых, доры на ред баттон ввс хренового лезут в индекс я�?и.
В-третьих, чтобы такие доры хоро�?о лезли в индекс нужны хоро�?ие ресурсы.
В-четвертых, оно того не стоит, есть методы попроще и похитрее.

Последний раз редактировалось Eladi; 04.08.2009 в 13:59.
Eladi вне форума 
Ответить с цитированием
Старый 04.08.2009, 22:38   #9
 
Регистрация: 01.08.2009
Сообщений: 58
Отправить сообщение для Палево-Шмалево с помощью ICQ


По умолчанию

2 Eladi
Такие генерированные тексты можно юзать не только в дорах.
Если придумать как сохранять смысл на протяжении хотя бы 3-4 предложений, то это будет офигенно. Много ифны прочитал про принципы работы поисковых систем. Существуют быстрые алгоритмы извлечения информации из текста и ее структуризации... Если текст не получается структуризовать, то ПС делает вывод, что текст - бред. �?МХО, конечно.
Палево-Шмалево вне форума 
Ответить с цитированием
Старый 05.08.2009, 00:05   #10
 
Регистрация: 16.07.2009
Адрес: На югах
Сообщений: 25


По умолчанию

Над алгоритмами пс работают дохуя лингвистов, филологов и еще хуй знает кого. Потом плод их коллективного труда, воплощает в жизнь команда кодеров. Так что на данный момент у яндекса охуенное преимущество над одиночными разработчиками чудо генераторов.

Как уже сказал Eladi, есть гораздо более простые рабочие метоты, не стоит ебать мозги и просиживать сутками за созданием сомнительных алгоритмов. Луч�?е за это время нахуярить пол сотни тех же сателлитов, у них и контент со смыслом и в бан редко попадают.
__________________
Всё вокруг - заговор, направленный против меня одного.
SmItHrIx вне форума 
Ответить с цитированием
Ответ

Метки
генератор текста

« Предыдущая тема | Следующая тема »
Опции темы
Версия для печатиВерсия для печати
Отправить по электронной почте

Ваши права в разделе
Вы не можете создавать новые темы
Вы не можете отвечать в темах
Вы не можете прикреплять вложения
Вы не можете редактировать свои сообщения

BB коды Вкл.
Смайлы Вкл.
[IMG] код Вкл.
HTML код Выкл.

Быстрый переход



Текущее время: 00:54. Часовой пояс GMT +3.


Powered by vBulletin® Version 3.8.3
Copyright ©2000 - 2010, Jelsoft Enterprises Ltd. Перевод: zCarot