Личные инструменты
Просмотры

Шингл

Материал из SEO — Энциклопедия

Перейти к: навигация, поиск

Шингл – это ячейка, частичка, кирпичик – во всяком случае, если брать значения, которые имеет это слово в английском языке, откуда оно родом. В сфере продвижения сайтов шингл означает те самые частички-кирпичики, из которых строится текст, и является основой для самого надежного метода проверки уникальности текста. Шингл в этом значении имеет прямое отношение к лингвистическому анализу текста и как метод и понятие существует с 1997 года, когда Andrei Broder, высокопоставленный сотрудник Yahoo! предложил его для повсеместного использования. Пользуясь исследованием текста с помощью шинглов можно безошибочно отделить уникальный текст от синонимизированного контента. В настоящее время, когда SEO-оптимизация приобретает профессиональный уровень, вопрос шинглов и работы с ними стал еще более актуален.

Подготовка текста

Шингл – это небольшой, состоящий из нескольких слов, фрагмент текста, обработанный по специальной методике для анализа. Эта методика – канонизация – состоит в том, что текст облегчается на все несущественные для смысла и грамматики слова (союзы, предлоги, междометия) и знаки препинания. В качестве примера возьмем следующую фразу:

“Здесь список из огромного количества городов, и в каждом есть игорные заведения, здесь сотни этих нелегальных казино”, – сказал Медведев.

После канонизации она будет выглядеть так:

здесь список огромного количества городов каждом есть игорные заведения здесь сотни этих нелегальных казино сказал Медведев.

Составление шинглов

Второй этап работы с текстом: непосредственное выделение шинглов. Для этого в первую очередь нужно определить длину шингла. Чем меньше шингл, тем больше работы и тем точнее анализ. Минимальный шингл равен трем словам, максимальный – восьми. Более длинный шингл зачастую не имеет смысла, так как при такой проверке допускается слишком много погрешностей. Одно из правил составления шингла – внахлест, то есть с захватом как минимум одного слова из предыдущего шингла. Именно это даст возможность скрупулезной проверки всех слов.

Например, первый трехсловный шингл фразы будет выглядеть так:

здесь список огромного

А второй шингл может иметь варианты:

список огромного количества и огромного количества городов

По такому принципу составляются все шинглы текста: внахлест, с равным числом слов в шингле.

Алгоритм шинглов

Далее программистом вырабатывается контрольная сумма текста. Алгоритм шингла предполагает сравнение шинглов двух разных текстов, определяя не является ли один из них дубликатом второго. Поисковые системы, в которые заложен программный метод шингловой поверки, обмануть очень трудно. Они находят подобные документы и сравнивают число совпадений шинглов, четко выявляя отсутствие уникальности. Поэтому при размножении текста нужна кропотливая работа по синонимизации, разбавлению и структурированию текста, замене фразеологических выражений, что сделает его не похожим на оригинал. Однако риск быть уличенным поисковой системой в неоригинальном тексте исчезает лишь в том случае, если используются действительно уникальные статьи.