Форум о seo технологиях  
Друзья Форум вебмастеров
Bookmark and Share
Старый 01.01.2010, 22:57   #1
1cv7
Дорвейщик
 
Аватар для 1cv7
 
Регистрация: 22.11.2009
Сообщений: 475
По умолчаниюКак Яндекс палит синонимизацию?

Какие мнения на этот счет? Как он понимает, что перед ним синонимизированный текс?
Есть задумка "непростого" синонимайзера, интересуют мнения об алгоритме по которому он отлавливает такие тексты
1cv7 вне форума  Ответить с цитированием
Старый 01.01.2010, 23:54   #2
wal
Дорвейщик
 
Регистрация: 05.07.2009
Сообщений: 162
По умолчанию

вот как-то так https://arbadoor.ru/showthread.php?t=715 =)
wal вне форума  Ответить с цитированием
Старый 26.01.2010, 23:15   #3
zloi
Полудорвейщик
 
Аватар для zloi
 
Регистрация: 18.01.2010
Сообщений: 26
По умолчанию

Цитата:
Сообщение от 1cv7 Посмотреть сообщение
Как он понимает, что перед ним синонимизированный текс?
Зачем так усложнять то? Раз палит синонемайз - не используй его. Все го то делов.
Отключи сиснонемайзинг в доргене, и путь он делает мешаный копипаст, сами яндексовцы давно спалили, что копипаст они не обламывают. Или это ущемляет индивидуальность созданных доров? Так всем кроме владельцев оных глубоко пох.ю что там, копипаст или синонемайз.

Зы: Понимаю что флуд, можно кидаться помидорами...
__________________
СуперХер
zloi вне форума  Ответить с цитированием
Старый 26.01.2010, 23:25   #4
saschok
Профи
 
Аватар для saschok
 
Регистрация: 04.08.2009
Сообщений: 519
По умолчанию

Цитата:
Сообщение от zloi Посмотреть сообщение
Зачем так усложнять то? Раз палит синонемайз - не используй его. Все го то делов.
Отключи сиснонемайзинг в доргене, и путь он делает мешаный копипаст, сами яндексовцы давно спалили, что копипаст они не обламывают. Или это ущемляет индивидуальность созданных доров? Так всем кроме владельцев оных глубоко пох.ю что там, копипаст или синонемайз.

Зы: Понимаю что флуд, можно кидаться помидорами...
я помидорами кидаться не буду, синонимайзер с разу палиться, хуй знает каким образом, по факту, мои доры на синонимайзере не жили даже 2 апа. Мое мнение ну читаю я тексь, да ебана сам почитай поймешь почему, ибо, неужели, всякая другая подобная хренб в глаза бросается сразу, потом можно убрать предлоги пох, но даже и без предлогов он палится, читай текст и увидишь все. Нах............. алгоритмы проще есть,и работают
saschok вне форума  Ответить с цитированием
Старый 26.01.2010, 23:51   #5
Kees
Дорвейщик
 
Аватар для Kees
 
Регистрация: 11.10.2009
Сообщений: 210
По умолчанию

Есть мысль (не моя) что синонимайз палится из-за употребления слишком большого количества малоупотребляемых слов. Нормальная речь обычного человека использует весьма средний по объему лексикон, так же и с письменной речью. При синонимайзе увеличивается процент редко используемых слов, ибо общеупотребительные слова приходится заменять на их малоупотребляемые аналоги, что ясен хуй вызовет подозрения.
Kees вне форума  Ответить с цитированием
Старый 27.01.2010, 00:10   #6
Убийца бабочек
Дорвейщик
 
Аватар для Убийца бабочек
 
Регистрация: 14.11.2009
Адрес: web
Сообщений: 158
По умолчанию

хз на счёт синонимайза, а вот копипаст нормально на гумноварезниках живёт)
а на дорах, у меня отлично живёт перевод рефератов с укр на рус.
Убийца бабочек вне форума  Ответить с цитированием
Старый 27.01.2010, 00:19   #7
pirate
Дорвейщик
 
Аватар для pirate
 
Регистрация: 17.11.2009
Адрес: SPb
Сообщений: 156
По умолчанию

у Яши база синонимов намного больше, чем в любом синонимайзере. Структура предложения не меняется, кол-во слов не меняется, процент замен маленький (одно, два слова на предложение).

Вот некоторые математические способы, если интересно конечно

"Сравнительный анализ методов определения нечетких дубликатов для Web-документов"
http://download.yandex.ru/company/do...aper_65_v1.pdf
__________________
ICQ не пользуюсь!
pirate вне форума  Ответить с цитированием
Старый 28.01.2010, 16:38   #8
Darth Wayer
Дорвейщик
 
Аватар для Darth Wayer
 
Регистрация: 06.07.2009
Адрес: В России-матушке
Сообщений: 380
По умолчанию

Цитата:
Сообщение от pirate Посмотреть сообщение
у Яши база синонимов намного больше, чем в любом синонимайзере. Структура предложения не меняется, кол-во слов не меняется, процент замен маленький (одно, два слова на предложение).

Вот некоторые математические способы, если интересно конечно

"Сравнительный анализ методов определения нечетких дубликатов для Web-документов"
http://download.yandex.ru/company/do...aper_65_v1.pdf
А что такое IDF в данном документе?
Цитата:
слова со средними значениями IDF
UPD. Нашёл!
Цитата:
IDF (inverse document frequency — обратная частота документа) — инверсия частоты, с которой некоторое слово встречается в документах коллекции.
__________________
отвечай тенета зачес тношенье
доверяй телефонам неутоленное

Последний раз редактировалось Darth Wayer; 28.01.2010 в 16:55. Причина: Сам нашёл )
Darth Wayer вне форума  Ответить с цитированием
Старый 05.02.2010, 10:15   #9
chayka
Дорвейщик
 
Регистрация: 04.07.2009
Сообщений: 130
По умолчанию

Закон Зипфа это называется... Вики полистайте... Генераторы они придумывать собрались :D
__________________
ICQ#: 429-363-521
chayka вне форума  Ответить с цитированием
Старый 05.02.2010, 13:23   #10
Darth Wayer
Дорвейщик
 
Аватар для Darth Wayer
 
Регистрация: 06.07.2009
Адрес: В России-матушке
Сообщений: 380
По умолчанию

Цитата:
Сообщение от chayka Посмотреть сообщение
Закон Зипфа это называется... Вики полистайте... Генераторы они придумывать собрались :D
Закон Зипфа для достаточно большого текста на естественном языке.
А тут речь об определении нечётких дубликатов.
__________________
отвечай тенета зачес тношенье
доверяй телефонам неутоленное
Darth Wayer вне форума  Ответить с цитированием
Ответ

« Предыдущая тема | Следующая тема »

Здесь присутствуют: 1 (пользователей: 0 , гостей: 1)
 
Опции темы
Версия для печатиВерсия для печати
Отправить по электронной почтеОтправить по электронной почте

Ваши права в разделе
Вы не можете создавать новые темы
Вы не можете отвечать в темах
Вы не можете прикреплять вложения
Вы не можете редактировать свои сообщения

BB коды Вкл.
Смайлы Вкл.
[IMG] код Вкл.
HTML код Выкл.

Быстрый переход


Текущее время: 21:37. Часовой пояс GMT +3.


Powered by vBulletin® Version 3.8.6
Copyright ©2000 - 2010, Jelsoft Enterprises Ltd. Перевод: zCarot
General Media Group