Многомерное шкалирование: различия между версиями

[отпатрулированная версия][отпатрулированная версия]
Содержимое удалено Содержимое добавлено
Нет описания правки
м викификация, стилевые правки
Строка 1:
{{Underlinked|date=апрель 2016}}
'''Многомерное шкалирование''' — метод [[Анализ данных|анализа и визуализации данных]] с помощью расположения точек, соответствующих изучаемым (шкалируемым) объектам, в [[Многомерное пространство|пространстве]] меньшей [[Размерность пространства|размерности]], чем пространство признаков объектов. Точки размещаются так, чтобы попарные расстояния между ними в новом пространстве как можно меньше отличались от [[Эмпирические исследования|эмпирически]] измеренных расстояний в пространстве признаков изучаемых объектов. Если элементы [[Матрица расстояний|матрицы расстояний]] получены по интервальным шкалам, метод многомерного шкалирования называется метрическим. Когда шкалы являются порядковыми, метод многомерного шкалирования называется неметрическим. Мера различий расстояний в исходном и новом пространстве называется функцией стресса.
 
== Области применения ==
* Поиск [[Скрытые переменные|скрытых переменных]], объясняющих полученную из опыта структуру попарных расстояний между изучаемыми явлениями.
* Проверка гипотез о расположении изучаемых явлений в пространстве скрытых переменных.
* Сжатие полученного опытным путём массива данных путём использования небольшого числа скрытых переменных.
Строка 9:
 
== Функция расстояния ==
Функцией расстояния называется функция от двух аргументов, которая двум шкалируемым объектам ставит в соответствие двум шкалируемым объектам расстояние <math>d(a_i, a_j)</math> между ними так, что выполняются следующие аксиомы: <math>d(a_i, a_j)=0</math> в том и только том случае, когда объекты <math>a_i</math> и <math>a_j</math> совпадают (рефлексивность расстояния), <math>d(a_i, a_j)=d(a_j, a_i)</math> (симметричность расстояния), <math>d(a_i, a_j)+d(a_j, a_k) \geqslant d(a_i, a_k)</math> (правило треугольника).
 
== Функция близости ==