<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Счастливый веб =) &#187; content</title>
	<atom:link href="http://web-happy.ru/tag/content/feed/" rel="self" type="application/rss+xml" />
	<link>http://web-happy.ru</link>
	<description>Ай лав SEO, PHP, MySql, JavaScript, CSS, HTML, jQuery, Python</description>
	<lastBuildDate>Mon, 14 Jun 2010 09:49:56 +0000</lastBuildDate>
	<generator>http://wordpress.org/?v=2.8.4</generator>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
			<item>
		<title>Продвижение сайта под НЧ</title>
		<link>http://web-happy.ru/2009/11/26/prodvizhenie-sajta-pod-nch/</link>
		<comments>http://web-happy.ru/2009/11/26/prodvizhenie-sajta-pod-nch/#comments</comments>
		<pubDate>Thu, 26 Nov 2009 07:57:17 +0000</pubDate>
		<dc:creator>web-happy</dc:creator>
				<category><![CDATA[Без рубрики]]></category>
		<category><![CDATA[content]]></category>
		<category><![CDATA[engine]]></category>

		<guid isPermaLink="false">http://web-happy.ru/?p=265</guid>
		<description><![CDATA[Хороший пост с серча

Лучше от 1 до 3 НЧ несвязанных друг с другом
И от 3 до 7 связанных с друг другом.
В титле только несвязанные, дабы не заспамить.
Статьи на 1,5 &#8211; 2 к символов.
+ картинки с альтами (оч. желательно)
Чтобы не было вопросов:
связанные= похожие:
1. Скачать фифа
2. Скачать fifa
3. Скачать фифа 2008
4. Скачать fifa 2008 бесплатно
5. ну понятно
несвязанные:
1. [...]]]></description>
			<content:encoded><![CDATA[<p>Хороший <a href="http://forum.searchengines.ru/showthread.php?t=426307&#038;page=2">пост</a> с серча</p>
<div style="border:1px dotted grey; margin-left:20px;">
Лучше от 1 до 3 НЧ несвязанных друг с другом<br />
И от 3 до 7 связанных с друг другом.<br />
В титле только несвязанные, дабы не заспамить.</p>
<p>Статьи на 1,5 &#8211; 2 к символов.</p>
<p>+ картинки с альтами (оч. желательно)</p>
<p>Чтобы не было вопросов:<br />
связанные= похожие:</p>
<p>1. Скачать фифа<br />
2. Скачать fifa<br />
3. Скачать фифа 2008<br />
4. Скачать fifa 2008 бесплатно<br />
5. ну понятно</p>
<p>несвязанные:<br />
1. Скачать фифа<br />
2. Скачать симулятор футбола
</p></div>]]></content:encoded>
			<wfw:commentRss>http://web-happy.ru/2009/11/26/prodvizhenie-sajta-pod-nch/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Шинглы: проверяем тексты на схожесть</title>
		<link>http://web-happy.ru/2009/11/17/shingly-proveryaem-teksty-na-sxozhest/</link>
		<comments>http://web-happy.ru/2009/11/17/shingly-proveryaem-teksty-na-sxozhest/#comments</comments>
		<pubDate>Tue, 17 Nov 2009 12:43:41 +0000</pubDate>
		<dc:creator>web-happy</dc:creator>
				<category><![CDATA[articles]]></category>
		<category><![CDATA[content]]></category>
		<category><![CDATA[yandex]]></category>

		<guid isPermaLink="false">http://web-happy.ru/?p=188</guid>
		<description><![CDATA[На первый взгляд, размеры базы поисковика – фактор далеко не критический. Но на самом деле, значение он имеет достаточно большое. Например, чем больше база Гугла, тем больше растёт его популярность и посещаемость. Основная причина такой закономерности – это редкие запросы, то есть, те, по которым поисковик находит менее 100 документов. Эти запросы составляют из общей [...]]]></description>
			<content:encoded><![CDATA[<p>На первый взгляд, размеры базы поисковика – фактор далеко не критический. Но на самом деле, значение он имеет достаточно большое. Например, чем больше база Гугла, тем больше растёт его популярность и посещаемость. Основная причина такой закономерности – это редкие запросы, то есть, те, по которым поисковик находит менее 100 документов. Эти запросы составляют из общей массы 30%.<br />
<span id="more-188"></span><br />
Но рост базы подразумевает под собой возникновение некоторых логических проблем, например, способность быстро реагировать на повторы и мусор и т.д. Копии документов в Интернете могут иметь различное происхождение. К примеру, один и тот же документ, размещённый на одном и том же сервере, может иметь отличия по техническим факторам: разные форматы, кодировки, переменные вставки (текущая дата, реклама и т.д.).</p>
<p>Достаточно многие документы копируются и редактируются в Интернете. Среди методов редактуры наиболее популярны корректура, раскрытие темы, ревизия и т.д. Или же текст может быть намеренно скопирован и изменён. Правда, есть и ещё один класс внешне мало различных документов: форумы, анкеты и т.д.</p>
<p>Если повтор полный, то проблем, можно сказать, не возникает. В данном случае, в индексе сохраняется контрольная сумма текста и все остальные тексты, у которых такая же контрольная сумма, просто игнорируются. Но этот метод совершенно не подходит для того, чтобы выявить отредактированные документы.</p>
<p>Для этого был разработан алгоритм «шинглов» (от слова shingles, «черепички, чешуйки»). Работает он примерно следующим образом. Для каждых 10 слов текста определяется шингл (контрольная сумма). Десятисловия перекрывают друг друга – это делается в целях, чтобы никакой отрывок текста не пропал. После из всех определённых сумм выбирают те, которые, к примеру, делятся на 15. К особенностям текста выборка не привязана, потому что контрольные суммы имеют равномерное распределение. Если найдено хоть одно идентичное десятисловие по контрольной сумме, то это – верный признак дублирования. Если же таких десятисловий много – скорее всего, вы наткнулись на искомую копию! Ведь один шингл, который совпал, соответствует пятнадцати десятисловиям, которые есть в полной версии текста. Чтобы выявить полный повтор документа, считают ещё одну контрольную сумму – супершингл. В данном случае, полной копией будет считаться только тот документ, где все шинглы полностью совпали.</p>
<p>Таким методом можно находить копии теста, а также источники и т.д. Теперь определять долю плагиата в статье стало очень просто. Но не стоит думать, что данная методика действует только на Западе. Схожий алгоритм выявления нечетких дублей разработан Яндексом.</p>
<p>Копипастил <a href="http://www.weblider.ru/article/article_65.html" target="_blank">отсудова</a></p>]]></content:encoded>
			<wfw:commentRss>http://web-happy.ru/2009/11/17/shingly-proveryaem-teksty-na-sxozhest/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>
