PDA

Просмотр полной версии : генерация текста в доргенах


Арбайтен
04.07.2009, 19:17
для доров для яндекса подавляющую роль играет генерация текста для дора.

кто что использует?

Drug Dealer
04.07.2009, 19:46
работаю с гуглом. использую редбатоновский генератор

netboy
04.07.2009, 19:55
тоже редбатоновский дорген использую + sp.
доры в я�?е индексятся,правда живут 1 ап.
за это короткое время дают норм трафа и прибыли.

Арбайтен
04.07.2009, 19:58
тоже редбатоновский дорген использую + sp.
доры в я�?е индексятся,правда живут 1 ап.
за это короткое время дают норм трафа и прибыли.

сколько я не работал с рб, хуй что у меня получалось.

вообще генерацию частенько нужно обновлять.

rcslexus
04.07.2009, 20:10
А кто нибудь в курсе как у этого доргена Lazzy v2.0 с генерацией текста???

Арбайтен
04.07.2009, 20:14
а кто нибудь в курсе как у этого доргена lazzy v2.0 с генерацией текста???

а о таком доргене даже не слы�?ал.

наверное я лузер

Ali
04.07.2009, 20:17
тож делаю некоторые доры на рб, причём если пачка проиндексируется, то уже не банится как минимум месяц, а то и более. проблема скорее в том чтоб загнать в идекс, не вижу чёткой логики: сделал то-то => индекс... какая-то рулетка получается.
на счёт контента, если правильно расставлять макросы можно добиться того, что дор будет выглядеть не хуже гс для сапы, даже местами с почти читабельным текстом :)

vegas
04.07.2009, 20:19
генерю редбатоном, ни каких проблем, все доры в я�?е.

rom
04.07.2009, 20:20
если речь по�?ла о генерации текста, использует ли кто синонимайзеры? или только генерируете доргеном?
арб, какой дорген из паблика по генерации контента наиболее подходящий для яндекса?

vegas
04.07.2009, 20:24
по моему это всё гавно :) про генерацию текста, если не лезут доры с говнотекстами и вы трясётесь над уникальностью, делайте доры вообще без текста. и не надо пиздеть что не лезут в индекс такие доры, у меня сидят доль�?е чем те, что с контентом.

Арбайтен
04.07.2009, 20:26
если речь по�?ла о генерации текста, использует ли кто синонимайзеры? или только генерируете доргеном?
арб, какой дорген из паблика по генерации контента наиболее подходящий для яндекса?

я использовал синонимайзер. у меня хуже оказалось. хз почему.

а по поводу паблика. там нет нормально генерации.

паблик доргены можно использовать, но меняйте там генерацию.

Ali
04.07.2009, 20:36
я использовал синонимайзер. у меня хуже оказалось. хз почему.

а по поводу паблика. там нет нормально генерации.

паблик доргены можно использовать, но меняйте там генерацию.

раз начал, так направь в какую сторону копать, имеется в виду алгоритм генерации?

Арбайтен
04.07.2009, 21:47
раз начал, так направь в какую сторону копать, имеется в виду алгоритм генерации?

в библиотеку

ищите способы генерации в различных мат. книжках.

я использовал генерацию по гильберту.

трудно, но зато хуй фильтр подберё�?ь

BigBoss
04.07.2009, 22:18
в библиотеку

ищите способы генерации в различных мат. книжках.

я использовал генерацию по гильберту.

трудно, но зато хуй фильтр подберё�?ь

гильберт, конечно довольно известный математик, но лингвистикой он не занимался...
хотелось бы поподробнее...

Арбайтен
04.07.2009, 22:30
гильберт, конечно довольно известный математик, но лингвистикой он не занимался...
хотелось бы поподробнее...

пиздец. а лингвистика, то тут причём?

BigBoss
04.07.2009, 22:51
пиздец. а лингвистика, то тут причём?

ты не депутат случаем?
отвечать на удобные вопросы, это привелегия депутатов...

я использую метод, примененный в dmi 2.5, только адаптированный под ра�?у.

ikolibri
04.07.2009, 23:19
я делаю на сп1.4
перед употреблением текст синонимизирую

лезут в индекс, но мас�?табов не добился еще.

sklip
05.07.2009, 10:16
я делаю на рб с модулем от ввс, бывает использую синонимизацию в модуле а бывает не использую

chayka
05.07.2009, 10:27
перепробовал я разные паки и вернулся обратно к рб 2.4, чего и вам советую. правда, еще толком трансформер не потестил, но, если не о�?ибаюсь, никаких инноваций относительно генерации текста там не появилось, поэтому можно смело сказать, что меня устраивает генерация текста от рб 2.4.

как уже не раз говорилось, что оценка сайта - это не только оценка текста, дизайна или ссылок. это во-первых комплекс из всего этого, а во-вторых это его структура.

для яндекса генерации текста особой не надо. если у вас не лезут на тексте от рб - ищете проблему в другом. в доре все должно быть на уровне.

vladimir770
05.07.2009, 11:26
посоветуйте какой дорген выбрать рб или джон22 или может еще какой заранее благодорю

art
05.07.2009, 11:31
посоветуйте какой дорген выбрать рб или джон22 или может еще какой заранее благодорю
рб - рунет
джон - буржуйнет

vladimir770
05.07.2009, 12:20
а рб какой луч�?е от лезвия или друга модефикация

sklip
05.07.2009, 12:22
а рб какой луч�?е от лезвия или друга модефикация
ну тут на вкус и цвет, кому то обычный нравится кому то моды, бери разные и делаи доры, потом выбере�? че луч�?е

vladimir770
05.07.2009, 12:26
ну тут на вкус и цвет, кому то обычный нравится кому то моды, бери разные и делаи доры, потом выбере�? че луч�?е

так они же все денег стоят а уменя есть 100 енотов вот хочу прикупить

art
05.07.2009, 13:32
так они же все денег стоят а уменя есть 100 енотов вот хочу прикупить
баттон есть нуленный, 2.4 версия.
трансформер около 60 wmz стоит
мод от vvs вроде уже не продается
как дела ща обстоят с суперпаками не знаю честно говоря

но по генерации текста все одинаковые, кроме вроде мода он vvs

renegad
05.07.2009, 13:33
так они же все денег стоят а уменя есть 100 енотов вот хочу прикупить

VVS Edition какаято сырая сборка, кроме модуля морфологии там ничего хоро�?его для себя не на�?ел, Transformer не юзал, но как я понял в нем кроме исправлений о�?ибок кода которые можно самому исправить в простом РБ и фич из SuperPack ничего особого нет. Как вариант юзать нуленые РБ 2.4.1 и суперпак 1.41 бесплатно, а потом когда деньги девать некуда будет можно и прикупить другие модификации, как раз их к тому времени доработают напильником.

vladimir770
05.07.2009, 14:02
vvs edition какаято сырая сборка, кроме модуля морфологии там ничего хоро�?его для себя не на�?ел, transformer не юзал, но как я понял в нем кроме исправлений о�?ибок кода которые можно самому исправить в простом рб и фич из superpack ничего особого нет. как вариант юзать нуленые рб 2.4.1 и суперпак 1.41 бесплатно, а потом когда деньги девать некуда будет можно и прикупить другие модификации, как раз их к тому времени доработают напильником.

спасибо за совет всем

kuban
05.07.2009, 14:38
товарищи кто даст трансформер рб поюзать

fromnull
05.07.2009, 15:09
Кто-нибудь тестировал Smart-Pages и генерацию текста, которая там реализована?

Memento
05.07.2009, 17:45
а разве все что на рб переделано использует свою генерацию текста, насколько я помню добавляется функционал, генерация таже что и в стандартном рб.

chayka
05.07.2009, 18:55
генерация таже что и в стандартном рб.
это уже сказали вы�?е.

я не пойму, из чего вы тут 3 страницы сделали? для яндекса генерации рб хватает - и точка.

D.Vinyard
05.07.2009, 19:06
кто-нибудь тестировал smart-pages и генерацию текста, которая там реализована?

я юзаю. очень доволен доргеном - есть встроенный парсер + синонимайзер контента (есть словарь синонимов под адалт с падежами). дорогой, конечно, продукт, но очень качественный.

wal
06.07.2009, 21:23
яндекс уже нас палит (http://yandex.ru/yandsearch?rpt=rad&text=%D0%B3%D0%B5%D0%BD%D0%B5%D1%80%D0%B0%D1%86%D0 %B8%D1%8F%20%D1%82%D0%B5%D0%BA%D1%81%D1%82%D0%B0%2 0%D0%B3%D0%B8%D0%BB%D1%8C%D0%B1%D0%B5%D1%80%D1%82) =)

Арбайтен
06.07.2009, 21:55
яндекс уже нас палит (http://yandex.ru/yandsearch?rpt=rad&text=%D0%B3%D0%B5%D0%BD%D0%B5%D1%80%D0%B0%D1%86%D0 %B8%D1%8F%20%D1%82%D0%B5%D0%BA%D1%81%D1%82%D0%B0%2 0%D0%B3%D0%B8%D0%BB%D1%8C%D0%B1%D0%B5%D1%80%D1%82) =)

Я защищал диплом по этому злоебучему Гильберту.

Если делать гибрид бинарных деревьев Хафмана и геометрическое построение текста Гильберта, то получается весьма неплохой текст.

Но мне впадлу это делать:)

Как Яндекс закрутит гайки, тогда и за Гильберта возьмёмся.

wal
06.07.2009, 22:27
я имел ввиду, что этот топик уже в выдаче яндекса по "генерация текста гильберт"

art
06.07.2009, 22:59
Как Яндекс закрутит гайки, тогда и за Гильберта возьмёмся.
а что тогда сейчас юзае�?ь?

Арбайтен
07.07.2009, 09:01
а что тогда сейчас юзае�?ь?

Другой самописный алгоритм

chayka
07.07.2009, 09:51
Другой самописный алгоритм

Мужики. Берите пример. Я, конечно, пока что не делаю прям доры нового поколения, но у моих доров есть фи�?ка, которая у других практически не встречается. Не то что бы прям нереальная тема, но есть, и из-за того, что вам тупо влом что-то сделать свое, ва�?и доры рубят пачками.

Посмотрите, на более менее известных дорвейщиков, как они делают доры:
- У одного свой дорген с генерацией текста, которой пока ни у кого нет.
- У другого просто самописный дорген, в котором есть функции, не присутствующие в паблик доргенах.
- У другого источник ссылок хоро�?их, у третьего еще какая-то лабуда. Четвертых всего-ли�?ь сотня, и они юзают одну тему, а остальных тысячи (!) �?, естественно, первым делом вы и будете попадать под удар.

Не може�?ь написать дорген? - Передалай хоть генерацию текста, добавить свои макросы.
Не може�?ь передеалть или дописать? - Делай хоро�?ие �?аблоны, поеби чутка мозг.
Не може�?ь хоро�?ие �?аблоны делать? - Делай другие эксперементы. Линковку пробуй разную, разную текстовку, прогоняй через трипиз синонимайзеры, делай нереальную структуру и т.д.
Не умее�?ь? - учись, php учи, алгоритмы разные.

Надо просто понять, что серая масса, она на то и серая масса, и просто клепая ежедневно доры далеко из нее не вылезе�?ь, надо ба�?кой думать.

Хух... накипело, серьезно... Если че, извините, но хочу что б до�?ло наконецто до тех, кто ищет паблик доргены с другой генерацией.

drax25
07.07.2009, 10:25
Мужики. Берите пример...
Хоро�?о написал:) Сам тоже об этом подумал...
-------------
Офтоп: неплохой форум получается, всего неск. дней, а уже столько интересной инфы:)

mrWEB
07.07.2009, 12:03
По�?ерстив выдачу возникает только одна мысль: зачем придумывать какую-то заумную генерацию, синонимизацию... если яндекс забит говнодорами с текстом (внимание палю тему :) ) типа : [RANDKEYWORD] [RANDKEYWORD] [RANDKEYWORD]... без запятых, точек и т.п и всё ето "говно" чувствует себя в топе оочень прекрано...

Memento
07.07.2009, 13:08
Угу, тоже прихожу к мысле, что чем проще тем луч�?е. :-)

mrWEB
07.07.2009, 13:16
Продолжу мысль... таких пару мегабайт "последовательных" ключей в текстовке да под "мАрковку" думаю будет вкусно. :) ...

wal
07.07.2009, 15:01
если кому интересно, могу рассказать как генерится текст в редбатоне(не по цепям маркова)

возможно, совместными усилиями сможем улуч�?ить его или вовсе придумать новый! =)

Ле Кряк
07.07.2009, 15:04
wal (https://arbadoor.ru/member.php?u=2), а напи�?и в двух словах, если не трудно. А то каюсь даже ни разу не запускал его, а лезть внутрь и подавно неохота.

wal
07.07.2009, 15:37
в двух словах это выглядит так:

1. выбирается случайным образом предложение из текста для генерации, с количеством слов > 3.
2. выбираются предложения со схожим количеством слов(плюс минус несколько слов) из для генерации.
3. Далее в зависимости от степени уникализации в цикле берется случайное предложение из того набора, что было получено в �?аге 2 и из этого предложения выбирается подряд несколько слов в зависимости от степени уникализации.
4. повторяем �?аг 3 при этом сдвигаемся в предложении на то количество слов, что было взято ранее(степень уникализации), повторяем до тех пор пока не достигнем лимита по количеству слов из �?ага 1.

вот таким не хитрым образом мы получаем предложение за предложением...

Ле Кряк
07.07.2009, 16:22
wal (https://arbadoor.ru/member.php?u=2), гы, если я правильно понял, то довольно бредово, это практически все равно что к примеру разбить исходный тект на N частей по M слов, переме�?ать эти N частей и заново соединить. В зависимости от языка программирования можно в одну строчку кода уложиться :)

wal
07.07.2009, 16:44
бредово или нет, но тем не менее это работает =)

zifanchuck
07.07.2009, 16:50
chayka, до етого додумался чуть рань�?е)))ввел в дорген (Рб) все что хотел. Щас он в стадии тестирование. Посмотрю как я�?ке понравится.

Ле Кряк
07.07.2009, 16:56
бредово или нет, но тем не менее это работает =)

Так и марковка работает :)

Eladi
07.07.2009, 21:09
ХЗ, с Яндексом все туго: "хоро�?ие" (в моем понимании) говнотексты банит, "плохие" нет. Сейчас провожу эксперименты по этому поводу.

для доров для яндекса подавляющую роль играет генерация текста для дора.


Арб, откуда такие выводы, ведь факторов для бани хватает и без текстовики?

fromnull
10.07.2009, 11:27
Возвращаясь к теме.

Как считаете, какими качествами должен обладать генерированный текст? Читабельности достаточно? Под читабельностью подразумевается грамматически верно построенные предложения, согласование падежей и т.д. Важно ли, чтобы текст был семантически верным (имел смысл)?

Арбайтен
10.07.2009, 11:30
Возвращаясь к теме.

Как считаете, какими качествами должен обладать генерированный текст? Читабельности достаточно? Под читабельностью подразумевается грамматически верно построенные предложения, согласование падежей и т.д. Важно ли, чтобы текст был семантически верным (имел смысл)?

Грамматика тут не причём.

fromnull
10.07.2009, 12:51
Почему же непричем? Часть грамматики, а точнее морфология, изучает вопросы построения предложений, то есть, фактически, то что нам нужно. А читабельный, пусть даже и семантически неверный контент, - как раз то что нужно ПС. Разве не так?

Арбайтен
10.07.2009, 12:55
Почему же непричем? Часть грамматики, а точнее морфология, изучает вопросы построения предложений, то есть, фактически, то что нам нужно. А читабельный, пусть даже и семантически неверный контент, - как раз то что нужно ПС. Разве не так?

Яндекс стал де�?ифровывать морфологическую подстановку.

invest
10.07.2009, 19:11
Яндекс стал де�?ифровывать морфологическую подстановку.

чтобы де�?ифровать, Яндекс должен понимать текст

fromnull
10.07.2009, 19:31
чтобы де�?ифровать, Яндекс должен понимать текст

Я так понял, имеется в виду рас�?ифровка синонимизации.. То есть, возможно что я�?ка видит в текстовке(после анализа многих страниц дора) много однотипных предложений, составленных по �?аблону, в которых меняются только слова, но набор структур предложения остается одним и тем же. В таком случае, действительно, спасет только генерация, т.к. "нарезка" текстовки приведет к боль�?ому числу разнотипных по структуре предложений. Либо же огромная база структур предложений для подстановки.

colgate
26.08.2009, 15:17
doorwayевский парсер плюс говноклеп:). на мой взгляд, луч�?е чем в рб(по крайней мере нулле рб)

SmiTT
26.10.2009, 01:22
Яндекс стал де�?ифровывать морфологическую подстановку.

Ну уж...
Сколько ресурсов надо в таком случае для анализа тонн появляющегося контента и сайтов?

Смысл в простоте

�?МХО разумеется

Apollon
26.10.2009, 07:49
Ну уж...
Сколько ресурсов надо в таком случае для анализа тонн появляющегося контента и сайтов?

Смысл в простоте

�?МХО разумеется

На это не на много боль�?е серверных мощьностей нужно! А в некоторых случаях и мень�?е, чтобы распознать дубли!

Dimon4ik
27.10.2009, 00:34
Грамматика имеет огромное значение в индексации дорвея и времени его нахождения в индексе Яндекса.
Я лично делаю доры по своему рецепту, они висят в индексе минимуму по месяцу и стабильно приносят траф. Естественно секрет раскрывать не буду, могу просто показать кусочек текста:blush:

В следующее мгновение улыбка на его лице расцвела, выдавая его с головой. Когда я вернулась, Лайм сидел на кровати и тер ладонями лицо. В ванной он изучил обрывок. - Затем более эмоционально: - Джеймс, мой мальчик, ведь это так важно, и ты совер�?енно прав в своих опасениях. Выключив двигатель, она вы�?ла из ма�?ины, поднялась по лестнице и толкнула парадную дверь. Для нее юные сиськи фото тогда это известие стало настоящим ударом. - Джереми пожал плечами. Оганесян подобрал одну карту, хотя в этом не нуждался. Но каким бы превосходным ни было искусство К. Молодой граф тоже взял плод граната,- из-за этого и произо�?ло юные сиськи фото все несчастье,- и вдруг одно зерны�?ко граната нечаянно выскользнуло из его руки

Арбайтен
27.10.2009, 00:42
Что то я тебе не верю.

�? есть от чего.

it.netov
27.10.2009, 00:47
Dimon4ik (https://arbadoor.ru/member.php?u=2), издевае�?ься? переме�?ка предложений из книг, текст без синонимизации, инклюд кея случайный. Такой алго пи�?ется за минуту.

Что то я тебе не верю.
да врёт он.

Арбайтен
27.10.2009, 00:49
Доры живут не мень�?е месяца:lol:

Главное лохов найти на обучение.

А ещё говорят я людей с Украины не люблю. Так ёб, у них главное наебать.

Арбайтен
27.10.2009, 00:57
Арбайтен я наебывать никого не собираюсь, хоро�?ий с тебя администратор, только я зарегался на форуме и оставил одно сообщение, ты уже матом покрыл.

Это где я матом покрыл?

Арбайтен
27.10.2009, 01:06
Здесь :negative::
�? какой тут мат в ва�?у сторону?

Арбайтен
27.10.2009, 01:14
У вас со зрением все хоро�?о? Дословно вы говорите, что я из Украины и хочу вас наебать. наебать - это мат, он адресован в мою сторону. Надеюсь теперь разъяснил???

А не по�?ёл бы ты нахуй?

it.netov
27.10.2009, 01:19
потёрто

Арбайтен (https://arbadoor.ru/member.php?u=6), эх, зря забанил парня. потрандели бы, может он что спалил бы (:

Палево-Шмалево
27.10.2009, 05:11
it.netov (https://arbadoor.ru/member.php?u=2), со мной потрынди. может я тебе че спалю. или ты мне. по теме текста.

it.netov
27.10.2009, 17:15
Палево-Шмалево (https://arbadoor.ru/member.php?u=2), давай. по какому алго текст для дора делае�?ь и как в него кеи инклюди�?ь?

я марков с пре и пост обработкой текста (устраняю бред в знаках препинания, тупые концовки текста и однословные предложения). кеи после n слов вставляю.

AlexStep
27.10.2009, 18:14
и как марков индексируется?

SmiTT
27.10.2009, 19:06
и как марков индексируется?

да молча индексится.
но индексится

Палево-Шмалево
27.10.2009, 19:12
it.netov (https://arbadoor.ru/member.php?u=2), есть несколько генераторов текста. Классический марков, марков адвансед-самоделка, так же реализовал все способы генерации от РБ, когда проводил исследования, есть морфологический подстановщик первого порядка (типа ДМ�?)... сейчас работаю над составлением семантических словарей и морфологическим подстановщиком второго порядка. Кеи вставляю так же как и ты, но место вставки - рандом. Как считае�?ь, распределение кеев по тексту равномерно - это хоро�?ая идея? Какой именно марков используе�?ь 1 или 2 порядка? может 3? Знаки препинания учитывае�?ь как отдельные слова или только вместе с предыдущим словом? �?нтересно, просто трачу достаточно много времени на алгоритмы генерации...

AlexStep (https://arbadoor.ru/member.php?u=2), классический марков долго в индексе не держится - факт.

ЫЫЫ
27.10.2009, 19:42
сейчас работаю над составлением семантических словарей и морфологическим подстановщиком второго порядка.

Что такое подстановщик второго порядка?

it.netov
27.10.2009, 20:44
AlexStep (https://arbadoor.ru/member.php?u=2), хоро�?о. На доменах im at с такой перелинковкой, что в ап по ~100 паг вылазит, и наглым редиректом кнопки вход (в новой вкладке ссылка открывалась, а на странице дора открывалась еще партнерка) доры жили до месяца.

Юзаю маркова, так как текст уник получается, а это по сути дает фору, т.к. минус несколько баллов для автобана.

Палево-Шмалево (https://arbadoor.ru/member.php?u=2), про равномерное распределение скажу так - чисто в теории я�?ка может просчитывать такое, даже если разные кеи (но в тегах). Но если ни тегов, ни похожести кеев (то есть вариации кея "а б в" - "в б а", "a в б" или вообще разные кеи), то можно юзать. Думаю, наверное, изменю у себя алго, чтобы не было равномерного инклюда.

Я марковку делаю так:
убираю мусор, затем разделяю по признаку что это слово, ну и пачку слов что после него идут добавляю в массив (пока смотрел как я это делаю, при�?ла идея, что надо бы ограничить вторые кеи с боль�?ой буквы). То есть как ты понял я знаки препинания вообще не учитываю. В пост обработке уже ставлю кое-где запятые (перед союзами, причастием "который" и т.п.), буду эту систему дорабатывать, боль�?е мест искать, где можно вставить красиво "," или может еще какие знаки, потом вычищаю плохие концовки (типа " слово на.") и однословные предложения.

Теперь вопросы от меня:
Марковка 1 2 3 порядков... это ты имее�?ь в виду учет, что �?ло после слова X, потом после слова Y, которое �?ло после слова X, так?

С дми никогда не разбирался - что такое морфологическая подстановка и что за семантический словарь?

Ты на чем коди�?ь (так для интереса, я на php)?

Палево-Шмалево
27.10.2009, 21:37
Марковка 1 2 3 порядков... это ты имее�?ь в виду учет, что �?ло после слова X, потом после слова Y, которое �?ло после слова X, так? именно, но тут нужна уже сравнительно боль�?ая статистика (10 метрами исходика не отделае�?ься) как следствие просто очень низкая скорость генерации. пробовал.

С дми никогда не разбирался - что такое морфологическая подстановка и что за семантический словарь?

постановка по �?аблону. пример:
исходник: "Это �?аблон предложения для генерации."
варианты генератора:
"Это двор одиночества для милиции. "
"Это арсенал довольствия для связи. "
"Это камин полотнища для функции. "
второй порядок подстановки - подстановка словосочетаниями(2 слова, 3 итд)
Семантический словарь - нечто вроде набора допустимых смысловых связей между словами. чтобы не получалось как в предыдущем примере... пока работаю над этим.
Ты на чем коди�?ь (так для интереса, я на php)?
отказался от php из-за низкой скорости работы с боль�?ими массивами текста. юзаю MSVS и delphi

spzero
27.10.2009, 21:48
Палево-Шмалево (https://arbadoor.ru/member.php?u=2), как яндекс ку�?ает морф. подстановку? А то тоже сделал пачку доров с таким текстом, пока жду индексацию :)

Палево-Шмалево
27.10.2009, 21:52
Палево-Шмалево, как яндекс ку�?ает морф. подстановку? А то тоже сделал пачку доров с таким текстом, пока жду индексацию :)

о, сюрприз будет!
зависит от тематики

it.netov
27.10.2009, 22:47
именно, но тут нужна уже сравнительно боль�?ая статистика (10 метрами исходика не отделае�?ься) как следствие просто очень низкая скорость генерации. пробовал.да, я еще когда только искал алго, читал, что следующие порядки тормозят мегакруто процесс.

Семантический словарь... а стоит ли заморачиваться? Не думаю, что вот это яндекс анализирует. Давольно таки ресурсоёмко. Да и генерация текста с использованием семантики будет ресурсоемкой.

К тому же задумайся... ты потом в свой красивый текст рандомно инклюди�?ь кеи (: Сразу портится вся его "красота", так стоит ли оно того?

p.s. - пример моего текста по марковке:
Головку на эмоции чувства вины в однообразно синей обложкой. Первая мысль и обру�?ил на лавки. Вековая ель потеряв�?ая все другое жалкие тени. Мерси покраснела. Что женщина у�?ла спонтанность. В сухих русел по катетам треугольника. Все убитые моей ма�?ине. Двадцать минут. Уверяю вас замечаю сидящего рядом. А сколько займет минуту. Так ряд исследователей.

AlexStep
27.10.2009, 23:10
почитал тему, и появилась идея вставлять ключевики по �?аблонам типа

Ключевик: текст.
Ключевик - текст.
Текст (Ключевик).
Текст, а также ключевик.
Текст, но возможно вас интересует ключевик.

если написать таких �?аблонов боль�?е чем ключевиков на одной странице, должно получатся неплохо

кто нибуть пробовал?

ЫЫЫ
27.10.2009, 23:51
Ключевик можно расставлять в естественных местах, где есть такие комбинации или части комбинаций слов в том же роде, числе, падеже, что и слово ключевика... :boredom:

it.netov
28.10.2009, 00:47
AlexStep (https://arbadoor.ru/member.php?u=2), думал над этим раннее. ХЗ, но как то так и не потестил это ни разу.


ЫЫЫ (https://arbadoor.ru/member.php?u=2), "смотреть короткие ролики"... Фраза текста "Я хочу ходить в �?колу". Результат: "Я хочу смотреть короткие ролики в �?колу". Бред, а значит не идеальный вариант. Так что одними падежами не обойтись.

spzero
29.10.2009, 12:01
Я сейчас ключи вставляю между предложениями, мне кажется так мень�?е палится.

Например так:

Оно искажает нацию более четырехсот колонн и �?естьсот теней в тоннеле.
КЛЮЧ. Через стр он азартно пожевал по телевизионной победе.
Любопытную обитель морей смело мое спасение, а возраст чести ли�?ь целиком оценил вносить столбики.
КЛЮЧ. - торжественно ее отменила гибель.
До этого она не перебирала ни одного из �?турмовиков.
У брови защищался руководитель.

it.netov
29.10.2009, 12:16
spzero (https://arbadoor.ru/member.php?u=2), ну а вообще доры живут так доль�?е или мень�?е?

spzero
29.10.2009, 12:26
it.netov (https://arbadoor.ru/member.php?u=2), хз , мои доры с такой генерацией текста пока не проиндексировались. Но уж пускай яндекс считает, что это отдельное предложение, чем криво вставленный кей, превращающий фразу в бредотекст.

it.netov
29.10.2009, 13:03
spzero (https://arbadoor.ru/member.php?u=2), отпи�?ись потом о резалтах. �?нтересно.

ЫЫЫ
29.10.2009, 23:14
AlexStep (https://arbadoor.ru/member.php?u=2), думал над этим раннее. ХЗ, но как то так и не потестил это ни разу.


ЫЫЫ (https://arbadoor.ru/member.php?u=2), "смотреть короткие ролики"... Фраза текста "Я хочу ходить в �?колу". Результат: "Я хочу смотреть короткие ролики в �?колу". Бред, а значит не идеальный вариант. Так что одними падежами не обойтись.

�?нетов ты не понял.
ключ :
девки сосут йух
фраза

Шикарные ма�?ины, тихо �?елестя колесами мчатся в сверкающий город.
итог
Шикарные девки, тихо �?елестя колесами сосут в сверкающий йух.

it.netov
29.10.2009, 23:58
ЫЫЫ (https://arbadoor.ru/member.php?u=2), теперь понял. �?дея хоро�?о, но честно говоря как прикину какой там алго будет навороченный, все желание отпадает возиться (:

Палево-Шмалево
30.10.2009, 01:12
Шикарные девки, тихо �?елестя колесами сосут в сверкающий йух.
доры с такой встройкой КВ будут проигрывать дорам с точным вхождением

it.netov
30.10.2009, 01:53
Палево-Шмалево (https://arbadoor.ru/member.php?u=2), по-крайней мере, без доп. прокачки или траста точно ловить нечего.

Кстати, а как думае�?ь, миксование кея (был "a b с", а стал "b c a" и т.п.) будет влиять на позиции?

Палево-Шмалево
30.10.2009, 03:40
Кстати, а как думае�?ь, миксование кея (был "a b с", а стал "b c a" и т.п.) будет влиять на позиции?

�?МХО, всегда я�?а отдает предпочтение точному вхождению ключа. Можно попробовать набить страницу вариациями:
abc
acb
cab
cba
bca
bac

получим боль�?у плотность не словосочетания, но каждого слова в отдельности - вариант достойный, смотрим выдачу...
ps Конечно, траст и все остальное - очень здорово. Нынче лом в Я�?е уже совсем не редкость.

Wer
02.11.2009, 19:34
То ли здесь, то ли на sateclub видел тему, где чел про какой-то алгоритм генерации текста рассказывал. (не Марков)
Совсем забыл что и где, мож видел кто нить? Хочется порыть в ту сторону..

Tony
02.11.2009, 19:50
Недавно видел, там обсуждали Закон Ципфа (http://ru.wikipedia.org/wiki/%D0%97%D0%B0%D0%BA%D0%BE%D0%BD_%D0%A6%D0%B8%D0%BF% D1%84%D0%B0)

Wer
02.11.2009, 20:16
Tony (https://arbadoor.ru/member.php?u=2), похоже, но не то :) Автора алгоритма как то на Б звали..

AlexStep
02.11.2009, 23:53
http://www.armadaboard.com/topic13711.html ?

dollarhunter
29.04.2010, 17:38
Первые попытки написать генератор текста. Про�?у оценить, луч�?е ли чем редбаттановского или хуже. (В теме 2 дня, строго не судите)

Эти заявления противоречат физиологии человека количество увеличивается количество макрофагов в собственной голове - мы заняты подсчетом своих экспериментов, заявил, что добровольных участников экспериментов кормили пищей, что прием пищи ослабляется действие естественного отбора на вне�?ний компонент полностью противоположная. В теле возникли стабильные мы�?ечные блоки уходят, отрицательный эмоции приводит к ней, но в мозгу собаки все свои теории питания (г. Хьюстон) доктор Дж. Форейт пи�?ет: "Модные диеты, суперсистемы, крема, чистки, аппараты и многое другое - движение крови 3,33 - мы вынуждены заметить одну и восточной медицины на его любви, и Советское правительство, поощряя активистов стахановского движения.
Не переживайте - 1 стакана потогонного кваса. Если для примера рассмотрим многие другие эксперименты, в гуще обычной деятельности, и вибромассажеры; почему низкоуглеводную диету. Процесс накопления жиров требуется не может синтезироваться несколько пониженный, но выпивает сладкий белковый коктейль и других болезнетворных клеток требуется значительно вы�?е.
Эти оба и комфортно, вы ничем не забывайте каждые 2-3 внизу, и должны заботиться о Боге и на долгосрочное месячное голодание. Несомненной заслугой автора книги этих практик самой важной на 13% поступив�?ей пищи менее склонным к крови, грубо говоря, растительные жиры, а это произносится мысленно, что чрезмерную потливость устраняется усиленным потением.

melory
29.04.2010, 20:04
Первые попытки написать генератор текста. Про�?у оценить, луч�?е ли чем редбаттановского или хуже. (В теме 2 дня, строго не судите)Есть куда улуч�?ать.) Такое чувство, что генератор оперирует словосочетаниями, а не словами. �? повтор: "количество увеличивается количество" есть.

dollarhunter
29.04.2010, 20:36
melory, да именно, словосочетания, нарезанные из текста. Так я надеялся умень�?ить количество вхождений не-сочетаемых слов)

melory
29.04.2010, 21:29
melory, да именно, словосочетания, нарезанные из текста. Так я надеялся умень�?ить количество вхождений не-сочетаемых слов)Теперь надо создать дор на тексте этого генератора. �? яндекс покажет тебе насколько он хоро�?. :dance: