PageRank: различия между версиями

[непроверенная версия][непроверенная версия]
Содержимое удалено Содержимое добавлено
Нет описания правки
Нежелательная ссылка и текст "вешалка"
Строка 1:
[[Файл:PageRanks-Example.svg|thumb|400px|Математический рейтинг вебстраницы (PageRank) для простой сети, выраженный в процентах (Google использует [[Логарифмический масштаб|логарифмическую шкалу]]). Вебстраница C имеет более высокий рейтинг, чем страница E, хотя есть меньше ссылок на C, чем на Е, но одна из ссылок на C исходит из более важных страниц и, следовательно, имеет более высокое значение. Если условно считать, что веб-пользователь, который находится на случайной странице, имеет 85%-ю вероятность выбора случайной ссылки на текущей странице, и 15%-ю — перехода на любую другую страницу, то вероятность перехода к странице E с других ссылок равна 8,1 % времени (15 % вероятности перехода к произвольной странице соответствует коэффициенту затухания 85 %). Без затухания все веб-пользователи в конечном итоге попадают на страницы A, B или С, и все остальные страницы будут иметь PageRank, равный нулю. При наличии затухания страница А эффективно связывает почти все ссылки на страницы в этой Сети, даже если она не имеет своих собственных исходящих ссылок.]]
'''PageRank''' («пэйдж-ранк»; от {{lang-en|Page rank}} — [[ранг]] страницы) — один из [[алгоритм]]ов [[Гиперссылка|ссылочного]] [[Ранжирование (поисковые системы)|ранжирования]]. Алгоритм применяется к коллекции документов, связанных [[гиперссылка]]ми (таких, как [[веб-страницы]] из [[Всемирная паутина|всемирной паутины]]), и назначает каждому из них некоторое численное значение, измеряющее его «важность» или «авторитетность» среди остальных документов. Вообще говоря, алгоритм может применяться не только к веб-страницам, но и к любому набору объектов, связанных между собой взаимными ссылками, то есть к любому [[Ориентированный граф|графу]].
 
'''Ссылочное ранжирование''' — фактор, влияющий на релевантность ссылок в зависимости от содержащегося в них текста. Проще говоря, если вссылке-анкоре содержатся ключевые слова и она ведет на сайт схожей тематики — сайт получит больше траста, поскольку поисковики будут считать такую ссылку более соответствующей тематике сайта.<ref name=":0">{{Cite web|url=https://links-stream.ru/chto-takoe-ssylochnoe-ranzhirovanie-faktory-i-metody/|title=Что такое ссылочное ранжирование: факторы и методы|publisher=links-stream.ru|accessdate=2020-02-17}}</ref>
 
== Описание ==
PageRank — это числовая величина, характеризующая «важность» веб-страницы. Чем больше [[гиперссылка|ссылок]] на страницу, тем она «важнее». Кроме того, «вес» страницы А определяется весом ссылки, передаваемой страницей B. Таким образом, PageRank — это метод вычисления веса страницы путём подсчёта важности ссылок на неё.
 
== История ==
В 1996 году [[Сергей Брин]] и [[Ларри Пейдж]], тогда ещё аспиранты [[Стэнфордский университет|Стэнфордского университета]], начали работу над исследовательским проектом BackRub<ref>[http://www.google.com/intl/en/corporate/history.html Corporate Information — Google Milestones<!-- Заголовок добавлен ботом -->]</ref> — поисковой системой по Интернету, использующей новую тогда идею о том, что [[веб-страница]] должна считаться тем «важнее», чем больше на неё ссылается других страниц, и чем более «важными», в свою очередь, являются эти страницы.<ref>[https://www.wired.com/wired/archive/13.08/battelle.html Wired: The Birth of Google]{{ref-en}}</ref> Через некоторое время BackRub была переименована в [[Google (поисковая система)|Google]]. Первая статья с описанием применяющегося в ней алгоритма ранжирования, названного PageRank, появилась в начале 1998 года<ref name="Page1998">{{статья
|автор=Lawrence Page, Sergey Brin, Rajeev Motwani and Terry Winograd.
|заглавие=The PageRank Citation Ranking: Bringing Order to the Web