Концепция семантических колец


Статьи про интернет-маркетинг, продвижение сайтов в поисковых системах, оптимизацию сайтов.

Факт налицо: оптимизацией под Яндекс занимаются все, кому не попадя, причем по любой теме. А что там? купил ссылок и вперед! Главное бюджет выбить. Бизнес оптимизации пойдет в сторону тематичности, даже если ее не будет учитывать Яндекс, но будет проводить в жизнь меры по борьбе с покупными ссылками. Почему? Ответы очевидны:
- чем больше внимания обращается на ссылки с морд, тем больше ссылки будут маскироваться под СВОЙ контент! а не под блоки рекламы, что привлечет за собой расходы на копирайтинг. Копирайтить на все темы (подо всех заказчиков) нельзя, заказчик тоже зачастую не может выдать нужный текст (либо ему приходится тратиться на копирайтинг). Значит, придется затачивать себя под какую-то тему, чтобы постоянно пользоваться своими шаблонами и знаниями.
- при введении контекстной рекламы на сайты-малютки (по сравнению с тревел.ру) владельцы еще больше будут задумываться про качественный контент и обмен посетителями именно на основании "тематичности" трафика, что однозначно повлияет на качество ссылок и на их цены. Порог вхождения на рынок купли/продажи ссылок будет выше, отчего в общей массе рынок уменьшится.
- совсем несложно догадаться, что высококонкурентные запросы должны подкрепляться семантическими кольцами, которые должны быть найдены на сайтах, которые вылезают по высококонкурнетным запросам. Объясняю. Яндекс обладает данными про определенные тематики, исходя из своего каталога. Напустили на него робот, вычислили частотность каждого слова/словосочетания, отделили тематические слова/словосочетания, составили из них семантические кольца на основе частотности слов/словосочетаний, прогнав через фильтр использования слов рядом друг с другом. Посмотрели в топ по этой тематике (список запросов получить несложно) определили соответствие сайтам в топе составленному шаблону релевантного сайта в данной тематике, отранжировали по-другому. У сайтов посвященных поиску работы семантическое кольцо вокруг слова "работа" будет сразу же отличаться от семантических колец вокруг слова "работа" на сайтах посвященных работам художников 20-го века. Можете возразить, что тогда просто будут продвигаться по семантическим кольцам, а не по запросам. ОК! А что еще надо? Сайт, который построен на основе цепей Маркова, исходя из данных про семантическое кольцо, читаться пользователями не будет, а значит надо писать контент! Плюс к этому человековремяресурсов на подобное именно комплексное продвижение потребуется ОЧЕНЬ много, и половина идиотов просто исчезнет.

Что же такое "семантические кольца" в моем понимании:

Семантические кольца — это то, чего нету ни у одного поисковика, но эту мысль они уже сейчас могут реализовать. Что сейчас делается? Берутся сайты с высокими Pr, ТИЦ, покупаются ссылки с них с нужными словами в качестве якорного текста. Приехали... кто знает про это, тот ставит ссылки и получает клиентов.

Что предлагаю я?
1. Я предлагаю учитывать ЛЮБЫЕ ссылки с документов с любым якорным текстом. Каждой ссылке давать вес.
2. Сделать алгоритм автоматического определения тематики документа.
3. Сделать аналог ранга для каждого документа, когда оценивается, насколько тематика документа соответствует тематике сайта, отсюда будет вытекать вес исходящих ссылок.

Каким образом разруливается вопрос о релевантности документа по определенному запросу, пример:
работа в Украине

Ссылки с сайтов с общей доминирующей тематикой "Работа" + ссылки с сайтов с общей доминирующей тематикой "Украина" на сайт, где доминирует тематика первого слова, а вторая просто присутствует.

Дальше, про семантические кольца, собственно. Благодая семантическим кольцам можно четко определять тематику сайта, причем особо не вдаваясь в то, что представляет из себя эта тематика.
Объясняю:
С каждым словом можно связать какой-то список слов, которые практически всегда употребляются рядом с этим словом. Отсортировать их не только по частоте их употребления, а по частоте их употребления именно с данным словом. Разбейте частотность употребления одного слова рядом с другим на диапазоны и разделите слова, получите кольца (если непонятно, могу нарисовать).

Пример:
со словом работа в смысле "заработок денег" чаще всего упоминаются:
вакансия, резюме, зарплата, трудоустройство, бухгалтер, строитель, менеджер, рекрутер
реже употребляется:
настойчивый, трудолюбивый, город Киев
еще реже:
мама, папа, дерево
Мы сформировали кольцо из слов вокруг слова "работа", общая тематика кольца "заработок денег".

со словом работа в смысле "работа художника" чаще всего упоминаются:
Айвазовский, искусство, творчество
реже:
кисть, палира
еще реже:
вакансия, резюме, зарплата

Т.е. вокруг слова работа, может возникнуть своеобразное кольцо слов, которые оттенят различные смыслы первого слова. Четко видно, что принадлежность сайта к тематике разруливаются при помощи слов, которые идут с ключевым словом рядом, а не по самому слову.

По односложным запросам вида:
работа
квартира
машина

Наиболее релевантными считаются те кольца, по которым больше сайтов либо документов (т.е. наиболее популярные тематики), а также, как второй вариант, где больше семантические кольца. Величина семантических колец может измеряться. Чем больше слов с высокой частотой употребления рядом с ключевым словом, тем больше семантическое кольцо, в центре которого стоит ключевое слово.

Тут, вроде бы объяснил.

К чему это все ведет.
Ведет это к тому, что ссылки на мордах с нужными словами продавать будет бессмысленно. Ссылка будет оцениваться по нескольким параметрам, включая тематический вес документа, с которого стоит ссылка, (т.е. насколько документ соотвествует тематике всего сайта), тематику самого документа, возможно, якорный текст, но только оценивается не точное вхождение, а как ударение на эти слова внутри предложения, которое должно соответствовать тематике документа.

Тематика документов будет формироваться из внутреннего наполнения в сочетании со ссылками с ресурсов с подобной тематикой. Т.е. чтобы поисковик понимал, что это документ с определенной тематикой, нужно не только иметь текст внутри документа, который вписывается в нужное семантическое кольцо, нужно еще, чтобы на этот документ стояли ссылки из близких тематик (находим таковые по пересечениям семантических колец).

Ссылки с каталогов автоматом будут иметь меньший вес, т.к. общая тематика каталога будет размыта.

Размещать нетематические каталоги будет невыгодно, т.к. они будут своим содержанием размывать общую тематику документов на сайте.

Спам-ссылки по форумам будут иметь мизерный вес, т.к. они будут абсолютно нетематичны для самого форума.

Тематичность документов должна оцениваться внутри поддомена, чтобы, например, порталы могли размещать контент по разным тематикам внутри разных поддоменов.

Для того, чтобы не было кучи перелинкованных между собой сайтов, которые за счет перелинковки и контента по нужным тематикам (заметьте, что не по запросам, а уже тематикам) выталкивают теже дорвеи в ТОП делаем следующее:
- у каждой ссылки учитываем возраст.
- учитываем сайты на которые стоит большое количество ссылок с большим возрастом, поднимаем этому сайту рейтинг, ссылкам с этого сайта доверяем больше
- проверяем, что на сайты с хорошим рейтингом постоянно появляются новые постоянные ссылки (те ссылки, которые не снимают), и что на сайты с хорошим рейтингом ссылаются другие сайты с хорошим рейтингом.
- проверяем на наличие нечетких дублей среди перелинкованных сайтов
- проверяем множественные клики одного и того же человека в СЕРПЕ, если по сайту большинство людей, которые несколько раз задают один и тот же поисковый запрос кликают только один раз, то есть вероятность плохого сайта по этой ссылке (сайта с плохим контентом)
- проверяем сайты на ссылки с одинаковым якорным текстом, проверяем эти же ссылки по наличию в рядом внутри якорного текста слов из семантических колец
- следим за взрывообразностью появления ссылок на сайт. Если что-то произошло, что заставило всех поголовно поставить ссылку на какой-то сайт (пример: появление milliondollarhomepage), то через какое-то время ссылки на этот сайт должны появиться на сайтах с высоким рейтингом. Если ссылки появились взрывообразно, но ссылок на сайтах с высоким рейтингом нет, то можно с определенной долей вероятности констатировать факт спама.
- следим за присутствием различных словоформ одного слова внутри ссылки (а также документов, внутри которых находится эта ссылка), чтобы не прокатывали ссылки вида "работа в Киеве, работы в Украине, работе в Одессе".

Короче, высказался, много бреда, много вещей, которые можно поддать критике, думаю, что появится при обсуждении много слабых мест. Для представителей поисковых систем нужно описать весь этот бред формулами, посмотреть слабые места, протестировать на практике, потому что я уверен, что какое-то рациональное зерно в моих размышлениях есть. Также думаю, что подобный алгоритм может немного видоизменить весь бизнес SEO и заставит его немного продвинуться в сторону качественного контента + качественного взаимодействия с сайтами из своей либо смежной тематики. Т.к. никто не будет знать, у кого какой рейтинг, а также, какой рейтинг у какого-то документа, с которого хочется поставить ссылку, то массовой скупки ссылок, думаю, не будет, или очень сильно упадут цены.





Работа в Виннице и в Киеве