PDA

Просмотр полной версии : Парсинг title


antagonist
21.07.2010, 09:50
Подскажите, если есть такая программа для сбора тайтлов страниц.

МонархЪ
21.07.2010, 10:37
Есть :flag_of_truce:


http://ifolder.ru/18611171


Набирай сообщения. Будет флуд я хоть поару как Арб тя попинает, ничего не бывает бесплатно

antagonist
21.07.2010, 10:41
А в свободном доступе есть?

МонархЪ
21.07.2010, 10:43
Забирай не умею с Хайдом работать :boredom:

i'm Nickname
21.07.2010, 11:07
.:: Hidden Block (you must be registered and have 1 posts) ::.

antagonist
21.07.2010, 11:18
МонархЪ Спасибо за ссылку.
i'm Nickname Ключи можно выбрать.

dollarhunter
21.07.2010, 11:24
.:: Hidden Block (you must be registered and have 3 posts) ::.

antagonist
21.07.2010, 11:33
dollarhunter Спасибо за совет, не подумал об этом.
А парсеры по сайтамапам просто переводят урлы страниц из транслита в кирилицу или тоже тайтлы выхватывают?

dollarhunter
21.07.2010, 11:38
Не видел ни одного из них в работе. Это скорее относится к дорам в индексе с чпу, где название страниц - кеи. Вот эти кеи можно спарсить и затем перевести с транслита.
На некоторых дорах встречается хтмл карта сайта, там вообще все кеи в готовом виде. А то что дор в индексе, тем более если не один ап, говорит о том что ключи не полное г, можно тырить.

Арбайтен
21.07.2010, 12:26
Нехуй велосипед делать. Парсите Вордстат и Лив.

FLASH
21.07.2010, 13:38
язл так умеет но сука глубина по сайту маленькая например если на дле дор ...

МонархЪ
21.07.2010, 15:39
Нахуя я буду бороться с Яндексом, и ебучим софтом под Вордстат паленым, если мне нужны хоро�?ие кеи. Вот если низкочастотники то другое дело.

Пиздите друг у друга кеи кароче, потом продайте комунить баксов за 40 гыгы

i'm Nickname
21.07.2010, 17:24
antagonist (https://arbadoor.ru/member.php?u=2), это в тайтле тогда кроме ключа других слов не должно быть, а то потом в ручную перебирать, этож ебанё�?ься.

antagonist
21.07.2010, 20:51
i'm Nickname Нет в основном в тайтлах идет разделение ключа от остального текста с помощью символов, например | или - и вот по ним уже можно отделять не в ручную, а с помощью Excel хотя бы.

dollarhunter
21.07.2010, 22:46
Ексель... Про регулярки (и их поддержку некоторыми нотепадами) ныне�?ние �?кольники не знают.
Не обиду. Но что может быть хуже для редактирования боль�?их объемов текста, чем эксель? Разве что поле ввода сообщения на форуме.

На самом деле... Пока ты строи�?ь хитрожопые схемы - все парсят анадырем вордстат и не заморачиваются ;)

antagonist
21.07.2010, 23:08
Ексель... Про регулярки (и их поддержку некоторыми нотепадами) ныне�?ние �?кольники не знают.
Не обиду. Но что может быть хуже для редактирования боль�?их объемов текста, чем эксель? Разве что поле ввода сообщения на форуме.

На самом деле... Пока ты строи�?ь хитрожопые схемы - все парсят анадырем вордстат и не заморачиваются ;)

Excel очень полезная �?тука, т.к. я не владею языкми программирования, он очень помогает при чистке текста, обрабатывал им объемы до 10мб, не знаю насколько это много, а вот ворд такие объемы практически не тянет, сразу вылетает.

Я насчет вордстата согласен, но туда попадают опять же не все ключи, вот для этих остав�?ихся, а также других словоформ и ре�?ил почекать тайтлы.

dollarhunter
21.07.2010, 23:27
notepad++ в помощь)

Как не все ключи в вордстате? А где они? Все что в яндексе ищут, там. Тысячи их)
Кроме того нужны ключи определенного диапазона частотности. Руками тысячи проверять? Анадырь это учитывает и фильтрует. Словоформы пофиг, яндекс переколдовывает, хватит начальной формы.

antagonist
21.07.2010, 23:39
notepad++ в помощь)

Как не все ключи в вордстате? А где они? Все что в яндексе ищут, там. Тысячи их)
Кроме того нужны ключи определенного диапазона частотности. Руками тысячи проверять? Анадырь это учитывает и фильтрует. Словоформы пофиг, яндекс переколдовывает, хватит начальной формы.

Вот простой пример запросы "собаки москва" и "собаки москвы" - результаты поиска различные, при парсинге с вордстата анадырь ничего не выдаст, потому что в результатах нет точного совпадения данного ключа. Ну а словоформы мне кажется нужны для того чтобы немного разбавить все точные ключи которые напарсены с вордстата, более нелогичными, т.е. человеческими.

antagonist
22.07.2010, 00:25
�? если можно еще в догонку вопрос, какого диапазона частотности желательно использовать ключи?

dollarhunter
22.07.2010, 10:03
Вот простой пример запросы "собаки москва" и "собаки москвы"Люди в кавычках не ищут. Без кавычек выдача не сильно отличаются. Те же сайты на других позициях.
�?зучи пхп, там пхпморфи. Напи�?и скрипт "склонятор", который будет ключи в разные морфологические формы ставить.
Но не думаю, что время того стоит (я не про изучение пхп конечно). Даже на белых сайтах тайтлы порой дибильнее чем на дорах, и ничего, в топе)

НЧ. У меня основная масса на дор до 500. Но разбавленная с ключами до 1000. Некоторые скажут что 500-1000 это не НЧ. Но среди них может быть много низко конкурентных.