Сессия (веб-аналитика)

Определение «сессия» (англ. Session), или «HTTP сессия», варьируется, особенно применительно к поисковым системам[1]. Обычно под сессией понимается «последовательность запросов, сделанных конечным клиентом (веб-браузером, приложением, краулером и др.) во время посещения определённого хоста»[2]. В контексте поисковых систем «сессия», или «сессия запросов», имеют как минимум два определения[1]. В широком смысле слова — это все запросы, сделанные пользователем в конкретный период времени[3]. В узком смысле «сессия» в веб-аналитике — это серия запросов или переходов с согласованной потребностью пользователя.

В Google Аналитике используется понятие «веб-сеанс»[4]. Яндекс.Метрика использует термин «сессия» или «визит»[5].

Описание править

Сессия - базовая эвристика для определения истории взаимодействий клиента и хоста по протоколу HTTP. Механизмы сессий и сеансов используются при построении эвристик более высокого уровня, таких как пользователь и др.

Сессия создаётся при первом запросе к хосту (серверу). При обращении клиента хост генерирует идентификатор сессии, который затем используется клиентом при каждом обращении к хосту пока существует сессия. На стороне хоста может быть реализована различная логика разрыва сессии: например, сохранение сессии долговременно, удаление сессии при завершении сеанса, открытие новой сессии при каждом переходе с нового источника, открытие новой сессии при идентификации (логине), удаление сессии через промежуток времени и др. Если клиент обращается к хосту с использованием не активного (например, удалённого или помеченного как не активный, устаревший) идентификатора сессии, то создаётся новая сессия. На стороне клиента разрыв HTTP сессии реализуется как правило через удаление идентификатора сессии. В разных клиентах это реализуется по-разному. В веб-браузерах это осуществляется в основном через обновление или удаление файлов Cookies.

В некоторых системах веб-аналитики сессия заканчивается, когда в течение определённого времени пользователь не совершает новых действий, например в Google Analytics и Яндекс.Метрика по умолчанию это 30 минут.

Подсчет органических сессий на сайте и рекламных отличается. Каждый переход по рекламе, независимо от времени пребывания пользователя на сайте, будет считаться как новый визит[6]. Также Google.Analytics всегда будет считать сессию завершённой, если по времени наступила полночь, а после полуночи продолжающаяся сессия считается новой[7].

Применение править

Сессии могут быть использованы для отчетов веб-аналитики, чтобы изучать поведение пользователей на веб-сайтах[8]. Исследуемые показатели включают продолжительность сеанса[9] и действия пользователя за сессию[10]. Длительность сеанса рассматривается как более точная альтернатива количеству просмотров страниц[11][12].

Сессии, которые прошли на сайте, также используются для измерения общего пользовательского трафика, в том числе для измерения количества рабочих часов, затраченных на создание Википедии[13]. Сессии также используются для оперативной аналитики, анонимизации данных, выявления сетевых аномалий и генерации искусственной рабочей нагрузки для тестирования серверов с искусственным трафиком[14][15].

Сессии хранят данные о сайте в момент взаимодействия пользователя с веб-ресурсом через браузер при помощи соответствующего ключа[16].

Благодаря оценке посещаемости сайта можно определять покупательскую вовлеченность, для этого следует учитывать продолжительность и частоту визитов на сайт, процент повторных визитов, давность визита, широту визита (процент посетивших сайт), а также статистику продаж через сайт[17].

Реконструкция сессии править

Веб-аналитики изучают сессии для получения необходимой информации о сайте, и важную роль здесь играет возможность идентификации сессий. Возможность реконструировать сессию пользователя также называют «восстановлением сеанса». Подходы к реконструкции сессии можно разделить на две основные категории: ориентированные на время и ориентированные на навигацию[18].

Ориентированный на время подход показывает определённый период неактивности пользователя, который называют «порогом неактивности». И когда наступает бездействие пользователя, предполагается, что он покинул сайт или полностью прекратил использование браузера, и сессия завершилась. Дальнейшие запросы от того же пользователя считаются вторым сеансом. Общее значение для порога неактивности пользователя составляет 30 минут[19][20]. Некоторые утверждают, что период сессии в 30 минут создает артефакты вокруг естественно длинных сеансов и экспериментируют с другими периодами[21][22]. Другие считают: «нет временного порога, эффективного при выявлении сессий»[23], есть альтернатива «порогу неактивности» в 30 мин, которая заключается в использовании пользовательских периодов пребывания на сайте[24][25].

Второй подход, который используют для изучения пользовательской сессии — это подход, ориентированный на навигацию. В этом случае, аналитики используют структуру веб-сайтов, в частности, наличие гиперссылок и склонность пользователей переходить между страницами одного и того же веб-сайта, нажимая на них, не вводя полный URL-адрес в своем браузере[26]. Один из способов идентификации сессий по этим данным состоит в том, чтобы создать карту веб-сайта: если можно определить первую страницу захода, сессия продолжается до тех пор, пока пользователь не окажется на странице, к которой нельзя получить доступ ни с одной ранее просмотренной страницы. При этом учитывается обратное отслеживание, когда пользователь будет пересматривать свои шаги перед открытием новой страницы[27]. Более простой вариант, который не учитывает обратное отслеживание, когда HTTP referer каждого запроса является страницей, которая уже находилась в сессии[28]. Если это не так, сессия считается как новая. Этот метод «демонстрирует очень низкую производительность» на сайтах, которые содержат наборы фреймов[29].

См. также править

Примечания править

  1. 1 2 Gayo-Avello, Daniel. A survey on session detection methods in query logs and a proposal for future evaluation // Information Sciences. — 2009. — № 179 (12). — С. 1822–1843. — ISSN 0020-0255. — doi:10.1016/j.ins.2009.01.026.
  2. Arlitt, Martin. Characterizing Web User Sessions // SIGMETRICS Performance Evaluation Review. — 2000. — № 28 (2). — С. 50–63. — doi:10.1145/362883.362920. Архивировано 15 мая 2021 года.
  3. Donato, Debora; Bonchi, Francesco; Chi, Tom. Do you want to take notes?: identifying research missions in Yahoo! search pad // Proceedings of the 19th International Conference on World Wide Web. — 2010.
  4. Определение веб-сеанса в Google  Аналитике - Cправка - Google Analytics. support.google.com. Дата обращения: 18 февраля 2020. Архивировано 17 марта 2020 года.
  5. Термины и определения - Метрика. Помощь. yandex.ru. Дата обращения: 18 февраля 2020. Архивировано 18 февраля 2020 года.
  6. Урок 2: Базовые понятия: просмотры, визиты, посетители. yandex.ru. Дата обращения: 5 марта 2020. Архивировано 24 октября 2019 года.
  7. Определение веб-сеанса в Google  Аналитике - Cправка - Google Analytics. support.google.com. Дата обращения: 5 марта 2020. Архивировано 17 марта 2020 года.
  8. Weischdel, Birgit; Huizingh, Eelko K. R. E. Website optimization with web metrics: a case study. — Proceedings of the 8th International Conference on Electronic Commerce. — 2006. — 463 с. — ISBN 978-1595933928. — doi:10.1145/1151454.1151525. Архивировано 4 марта 2016 года.
  9. Jansen, Bernard J.; Spink, Amanda. How are we searching the world wide web? A comparison of nine search engine transaction logs // Information Processing and Management. — 2006. — № 42 (1). — С. 248–263. — ISSN 0306-4573. — doi:10.1016/j.ipm.2004.10.007.
  10. Jansen, Bernard J.; Spink, Amanda; Saracevic, Tefko. Real life, real users, and real needs: a study and analysis of user queries on the web // Information Processing and Management. — 2000. — № 36 (2). — С. 207–227. — ISSN 0306-4573. — doi:10.1016/S0306-4573(99)00056-4.
  11. Khoo, Michael; Pagano, Joe; Washington, Anne L.; Recker, Mimi; Palmer, Bart; Donahue, Robert A. Using Web Metrics to Analyze Digital Libraries. — Proceedings of the 8th ACM/IEEE-CS Joint Conference on Digital Libraries. — ACM, 2008.
  12. Catledge, L.; Pitkow, J. Characterizing browsing strategies in the world-wide web" (PDF) // Proceedings of the Third International World-Wide Web Conference on Technology, Tools and Applications. — 1995. — № 27 (6). — С. 1065–1073. — doi:10.1016/0169-7552(95)00043-7.
  13. Geiger, R.S.; Halfaker, A. Using Edit Sessions to Measure Participation in Wikipedia // Proceedings of the 2013 ACM Conference on Computer Supported Cooperative Work. — ACM, 2014. — С. 861. — ISSN 9781450313315. — doi:10.1145/2441776.2441873.
  14. Meiss, Mark; Duncan, John; Gonçalves, Bruno; Ramasco, José J.; Menczer, Filippo. What's in a Session: Tracking Individual Behavior on the Web // Proceedings of the 20th ACM Conference on Hypertext and Hypermedia. — ACM, 2009. Архивировано 8 мая 2021 года.
  15. Arlitt, Martin. Characterizing Web User Sessions (PDF) // SIGMETRICS Performance Evaluation Review. — 2000. — № 28 (2). — С. 50–63. — doi:10.1145/362883.362920.
  16. Руководство часть 7: Сессии. Веб-документация MDN. Дата обращения: 18 февраля 2020. Архивировано 18 февраля 2020 года.
  17. Окольнишникова И.Ю. Как измерить степень покупательской вовлеченности в бренд? // Российское предпринимательство. — 2011.
  18. Spiliopoulou, Myra; Mobasher, Bamshad; Berendt, Bettina; Nakagawa, Miki. A framework for the evaluation of session reconstruction heuristics in web-usage analysis // INFORMS Journal on Computing. — 2003. — № 15 (2). — С. 171–190. — ISSN 1526-5528. — doi:10.1287/ijoc.15.2.171.14445.
  19. Ortega, J.L.; Aguillo, I. Differences Between Web Sessions According to the Origin of their Visits // Journal of Informetrics. — 2010. — № 4 (3). — С. 331–337. — ISSN 1751-157. — doi:10.1016/j.joi.2010.02.001.
  20. Eickhoff, Carsten; Teevan, Jaime; White, Ryen; Dumais, Susan. Lessons from the Journey: A Query Log Analysis of Within-Session Learning. — Proceedings of the Seventh International Conference on Web Search and Web Data Mining. — ACM, 2014. — С. 223–232. — ISBN 9781450323512. — doi:10.1145/2556195.2556217.
  21. Mehrzadi, David; Feitelson, Dror G. On Extracting Session Data from Activity Logs // SYSTOR '12. ACM. — 2012. — ISSN 978-1-4503-1448-0. — doi:10.1145/2367589.2367592. Архивировано 20 сентября 2019 года.
  22. He, Daqing; Goker, Ayse; Harper, David J. Combining evidence for automatic Web session identification // Information Processing and Management. — 2002. — № 38 (5). — С. 727–742. — ISSN 0306-4573. — doi:10.1016/S0306-4573(01)00060-7.
  23. Jones, Rosie; Klinkner, Kristina Lisa. Beyond the Session Timeout: Automatic Hierarchical Segmentation of Search Topics in Query Logs doi. — ACM. — 2008. — 699 с. — ISBN 9781595939913. — doi:10.1145/1458082.1458176.
  24. Murray, G. Craig; Lin, Jimmy; Chowdhury, Abdur. Identification of User Sessions with Hierarchical Agglomerative Clustering // Proceedings of the American Society for Information Science and Technology. — 2006. — № 43 (1). — С. 1–9. — doi:10.1002/meet.14504301312. Архивировано 21 сентября 2019 года.
  25. Mehrzadi, David; Feitelson, Dror G. On Extracting Session Data from Activity Logs (PDF) // SYSTOR '12. ACM.. — 2012. — ISBN 978-1-4503-1448-0. — doi:10.1145/2367589.2367592. Архивировано 20 сентября 2019 года.
  26. Spiliopoulou, Myra; Mobasher, Bamshad; Berendt, Bettina; Nakagawa, Miki. A framework for the evaluation of session reconstruction heuristics in web-usage analysis // INFORMS Journal on Computing. — 2003. — № 15 (2). — С. 171–190. — ISSN 1526-5528. — doi:10.1287/ijoc.15.2.171.14445.
  27. Cooley, Robert; Mobasher, Bamshad; Srivastava, Jaideep. Data Preparation for Mining World Wide Web Browsing Patterns // Knowledge and Information Systems. — 1999. — № 1 (1). — С. 19. — ISSN 0219-3116. — doi:10.1007/BF03325089.
  28. Cooley, Robert; Mobasher, Bamshad; Srivastava, Jaideep. Data Preparation for Mining World Wide Web Browsing Patterns (PDF) // Knowledge and Information Systems. — 1999. — 1 (1). — С. 5–32. — ISSN 0219-3116. — doi:10.1007/BF03325089.
  29. Berendt, Bettina; Mobasher, Bamshad; Nakagawa, Miki; Spiliopoulou, Myra. The Impact of Site Structure and User Environment on Session Reconstruction in Web Usage Analysis (PDF) // WEBKDD 2002 - Mining Web Data for Discovering Usage Patterns and Profiles. WEBKDD. Springer.. — 2003. — ISBN 978-3-540-39663-5. — doi:10.1007/978-3-540-39663-5_10.