Методов многомерного анализа данных много, но они разрозненные и, как правило, несводимые в единое целое. Многообразие этих методов обусловлено объективным многообразием изучаемых явлений, которые данные методы призваны отображать и измерять.
Ценность их определяется тем, насколько каждый из них и все они адекватны изучаемым предметам, полно и достоверно выявляют и объясняют скрытые причинно-следственные связи признаков, которые не могут быть установлены и предъявлены с помощью плоских одномерных расчетов и примитивных цифровых иллюстраций.многомерные методы имеют дело с неограниченными и разрозненными наборами наблюдаемых объектов и неочевидными и, как правило, многообразными и по преимуществу разнонаправленными взаимосвязями между их признаками.
Предметом наблюдения -все виды и формы связей, недоступные для простого наблюдения и изучения. При этом разнородность наблюдаемых объектов и многообразие признаков, характеризующих их, неочевидность и разнонаправленность взаимосвязей между ними определяются многомерной природой наблюдаемых явлений, формирующих сложное матричное множество пересекающихся неоднородных объектов и комплексных признаков, выявление и изучение которых невозможны с помощью простых одномерных методов. При применении многомерных методов и, следовательно, при работе в многомерных пространствах наблюдаемые объекты характеризуются тремя признаками и более.
Цель многомерных методов — выявление законов поведения путем установления характера распределения и тесноты связей между многими (обычно тремя и больше) признаками, позволяющими полно и детально изучать и объяснять наблюдаемые процессы, что в принципе невозможно сделать, оперируя традиционными одномерными методами.
Последовательность работы с многомерными методами. Разбивать сложные многомерные пространства на части, вводить их типы, соответствующие типам существующих теоретических допущений и распределений, т.е. решать задачу отдельно по каждому признаку или однородной группе признаков, применяя разные методы. В сущности, это означает переход от методов многомерного решения соответствующих классов задач к методам одномерного. Методы:
Кластерный анализ — это многомерная статистическая процедура, выполняющая сбор данных, содержащих информацию о выборке объектов, и затем упорядочивающая объекты в сравнительно однородные группы (кластеры)(Q-кластеризация, или Q-техника, собственно кластерный анализ). Кластер — группа элементов, характеризуемых общим свойством, главная цель кластерного анализа — нахождение групп схожих объектов в выборке. Спектр применений: в медицине, психологии, биологии, государственном управлении, филологии, антропологии, маркетинге, социологии.
Факторный анализ - это один из способов снижения размерности, то есть выделения во всей совокупности признаков тех, которые действительно влияют на изменение зависимой переменной. Или группировки сходно влияющих на изменение зависимой переменной признаков. Или группировки просто сходно изменяющихся признаков. наблюдаемые переменные являются лишь линейной комбинацией неких ненаблюдаемых факторов. Некоторые из этих факторов являются общими для нескольких переменных, некоторые характерно проявляют себя только в одной. Задачей факторного анализа является как раз восстановление исходной факторной структуры исходя из наблюдаемой структуры ковариации переменных, несмотря на случайные ошибки ковариации, неизбежно возникающие в процессе снятия наблюдения.
Коэффициент взаимосвязи между некоторой переменной и общим фактором, выражающий меру влияния фактора на признак, называется факторной нагрузкой данной переменной по данному общему фактору. Значение (мера проявления) фактора у отдельного объекта называется факторным весом объекта по данному фактору. Процесс факторного анализа состоит из трех больших этапов: Подготовки ковариационной матрицы; Выделения первоначальных ортогональных векторов (основной этап); Вращение с целью получения окончательного решения.
Метод главных компонентов используется для определения общих факторов (компонентов), от которых зависит множество случайных значений нескольких изучаемых показателей. Он предполагает разложение изучаемой корреляционной матрицы на независимые компоненты, число которых равно числу анализируемых переменных. В процессе анализа рассматриваются все компоненты, но можно оценить удельный вес каждого из них и выбрать нужное количество наиболее существенных компонентов.