PageRank в Google

PageRank в Google

345
0

27 июня 2014 — КУЛИБИНСК КЛУБ
article150.jpg

PageRank в продуктах Google

PR

PR (Page Rank) — это алгоритм учета внешних ссылок, который представляет компания Google. При помощи дата — центров Google и Google Toolbar можно узнать PR каждой страницы. Каждая страница имеет PR от 0 до 10. Google Toolbar преобразует количество внешних ссылок на сайт в показатель от 1 до 10. Для показателя 1 нужно от 1-10 внешних ссылок, для 2 от 10-100, 3 показатель должен составлять сумму от 100-1000 внешних ссылок, 4 от 1000-10.000 и т.д. Для того чтобы показатель PR достиг более высокого уровня необходимо в разы увеличить количество внешних ссылок.


Сейчас показатель PR широко используется Web-мастерами, для быстрой оценки раскрученности ресурса по поисковому запросу, и позволяет понять стоит ли покупать ссылку с данной страницы, или бороться за первые позиции по запросу. PR пересчитывается раз в 3-6 месяцев, поэтому Датацентры Google в период между обновлениями могут предоставлять устаревшую информацию.

Надстройка для браузера Google Toolbar показывает для каждой веб-страницы целое число от 0 до 10, которое она называет PageRank, или важностью этой страницы с точки зрения Google. Однако механизм его расчёта и что в точности обозначает это значение не раскрывается. По некоторым данным, эти значения обновляются лишь несколько раз в год, в то время, как внутренние значения PageRank пересчитываются непрерывно, и показывают значения PageRank страниц на логарифмической шкале.

Некоторые оптимизаторы заметили следующую особенность получения PR: Page Rank выше 5 могут получить сайты, которые прошли испытание возрастом, то есть довольно старые, заслуживающие доверия проекты или же очень большие проекты с большим количеством посещений (зачастую это социальные сети)

Значения PageRank (возможно, в сочетании с другими факторами) показываются также в виде зелёной полоски в каталоге сайтов Google Directory, где они используются для сортировки сайтов внутри разделов каталога.


ИСТОРИЯ

В 1996 году Сергей Брин и Ларри Пейдж, тогда ещё аспиранты Стэнфордского университета, начали работу над исследовательским проектом BackRub — поисковой системой по Интернету, использующую новую тогда идею о том, что веб-страница должна считаться тем «важнее», чем больше на неё ссылается других страниц, и чем более «важными» в свою очередь являются эти страницы. Через некоторое время BackRub была переименована в Google. Первая статья с описанием применяющегося в ней алгоритма ранжирования, названного PageRank, появилась в начале 1998 года, за ней следом вышла и статья с описанием архитектуры самой поисковой системы.

Их система значительно превосходила все существовавшие тогда поисковые системы, и Брин с Пейджем, осознав её потенциал, основали в сентябре 1998 года компанию Google Inc., для дальнейшего её развития как коммерческого продукта.

С тех пор алгоритмы и математические модели, применяемые при ранжировании в Google, значительно улучшились. В интервью в 2007 году Амит Сингхал, представитель отдела качества поиска Google, заявил, что их поисковая система использует более 200 ранжирующих сигналов, лишь одним из которых является PageRank, но он до сих пор играет существенную роль в поисковых продуктах Google. Стоит отметить, что алгоритм PageRank, в том виде, в каком он был изложен Пейджем в статье 1998 года, может быть улучшен в некоторых практических аспектах (например, ссылкам могут назначаться разные веса), и алгоритмы, применяемые в современных поисковых системах, являются скорее лишь его вариантами.

PageRank можно перевести с английского языка как «ранг страницы», однако Google Inc. связывает слово Page в названии алгоритма не с английским словом «страница», а с именем Ларри Пейджа (англ. Larry Page).

Название «PageRank» является торговой маркой компании Google Inc. Алгоритм запатентован в США 4 сентября 2001 года, в качестве изобретателя алгоритма в патенте указан Ларри Пейдж. Официальным владельцем патента является не Google Inc., а Стэнфордский университет, в котором учились Ларри Пейдж и Сергей Брин в момент подачи заявки на патент.

В 1998 году Google был одной из первых поисковых систем, внедривших ссылочное ранжирование, благодаря чему добился значительного улучшения качества поиска по сравнению с конкурентами. В дальнейшем многие крупные поисковые системы разработали и внедрили свои аналоги PageRank и другие методы статического (то есть запросо-независимого) ранжирования документов.











Математический рейтинг вебстраницы (PageRank) для простой сети, выраженный в процентах (Google использует логарифмическую шкалу). Вебстраница C имеет более высокий рейтинг, чем страница E, хотя есть меньше ссылок на C чем на Е, но одна из ссылок на C исходит из более важных страниц и, следовательно, имеет более высокое значение. Если условно считать что веб-пользователь который находится на случайной странице имеет 85 % вероятность выбора случайной ссылки, и 15 % оставления этой страницы без всякого перехода на её ссылки, то вероятности перехода к странице E с других ссылок равна 8,1 % времени. (15 % вероятности перехода к произвольной странице соответствует коэффициенту затухания 85 %.) Без затухания, все веб-пользователи в конечном итоге попадают на страницы A, B или С, и все остальные страницы будет иметь PageRank нуля. При наличии затухания, страница А эффективно связывает почти все ссылки на страницы в этой Сети, даже если она не имеет своих собственных исходящих ссылок.

по материалам Википедии — свободной энциклопедии



Обсудить на форуме
Теги: ссылки на информацию, свободной энциклопедии, рейтинг сайта, ранжирование, по материалам Википедии, компьютер, интернет, алгоритм учета внешних ссылок, pagerank в google, pagerank
Рейтинг: +1
Голосов: 1
1527 просмотров
Комментарии (0)

Нет комментариев. Ваш будет первым!

НЕТ КОММЕНТАРИЕВ

ОСТАВЬТЕ ОТВЕТ