Рефераты. Методы и процедуры маркетинговых исследований

 

 

 

VI. МНОГОМЕРНЫЙ АНАЛИЗ

 

  Множественно-корреляционный анализ


Этот анализ позволяет исследовать объем, прогнозировать уровень зависимой переменной, основываясь на  возможных изменениях более чем одной независимой переменной. Зависимость между 3 и более факторами называется множественной или многофакторной корреляционной зависимостью.


Коэффициенты называются коэффициентами условной корреляционной регрессии и являются именованными числами в различных единицах измерения, а, следовательно, не сравнимы друг с другом. На основании этих коэффициентов строятся относительные показатели тесноты связи, которые называются коэффициентами эластичности.

При увеличении фактора Xi на 1 % результативный фактор растет на Эi % (при условии, что другие факторы неизменны).

Основой изменения связи является матрица данных коэффициента корреляции.

Признаки

Y

X1

X2

Xn

 

у

 

1

 

-

 

-

 

-

Х1

r (YX1)

1

-

-

Х»

r (YX2)

r (X1X2)

1

-

Хn

r (YXn)

r (X1Xn)

r (X2Xn)

1


На основе этой матрицы можно судить о тесноте связей признаокв с результативным признаком и между собой.


Обычно матрицу используют для предварительного отбора факторов в уравнении регресии. Обычно в модель не включаются факторы, слабо связанные с результатом, но тесно связанные с другими факторами. Если фактор Хi тесно связан с фактором Xj, то говорят, что он коллинеарен с фактором Xi (см. Коэффициент множественной корреляции).


Наиболее общим показателем тесноты связи всех входящих в уравнении регрессии факторов с результатом является коэффициент множественной детерминации; он представляет собой отношение части вариации результативного признака, объясняемого за счет входящих в уравнение факторов к общей вариации результативного признака.

 


1.     Общая вариация (Yi - Y)2

2.   Необъясненная вариация (Yi - У)

3.   Объясненная = общая - необъясненная


Коэффициент детерминации = объясненная / общая

Объясняется теми факторами, которые включены в модель.


Значимость общего коэффициента корреляции.


Для  проверки используется распределение Фишера с вероятностью a и числами свободы:

1 = числу независимых переменных

2 = n - 3


                           R2 /2

F расчетное = (1 - R2) / (n - 3)


Так как F расчетное больше F табличного, следовательно, существенен и связь между У и X1Xn подтверждается.



Дискретный анализ


Дискретный анализ является статистическим методом, который позволяет изучить различия между двумя  и более группами объектов, по нескольким переменным одновременно. Он схож с множественно-регрессионным анализом, однако существует различие:

при регрессионном анализе зависимая переменная является количественной, а в дискретном анализе - качественной.


Цели дискретного анализа:

1.   Определение значимости различий между двумя и более группами.

2.   Построение модели, позволяющей классифицировать респондентов или объектов между группами на основании независимых переменных

3.   Проверка соответствия фактического дискретного множества расчетному, полученному по независимой переменной.


Для проведения дискретного анализа необходимо образовать две обучающие выборки Z1 и Z2 (может быть больше) - пользователи и непользователи.


            1

Z1 =   n1 * å( А0 +  B1*X1 +B2*X2 + Bn*Xn)


Предположим, что во множестве Z1 будут включены все покупатели данного продукта .

                     1

Z2 =   n2 * å( А0 +  B1*X1 +B2*X2 + Bn*Xn)

(никогда не покупают данного продукта)


Если индивидуальные значения ответов какого-либо респондента будут больше, чем полусумма (Z1i + Z2i), то такого респондента следует относить к пользователям, иначе к лицам, которые не покупают данный продукт.


Дискретный анализ может быть использован для ответа на вопросы:

n    как потребители какого-либо товара отличаются от тех, кто не покупает этот продукт.

n    как потенциальные потребители новых товаров, показывающие большую вероятность покупки данного товара отличается по демографическим признакам от тех, для кого характерна низкая вероятность покупки данного товара.

 


Плохо     1       2        3     4        5         6        7          8          9          10     Отлично


1.   Общее качество приготовленных блюд

2.   Расположенность недалеко от дома

3.   Близко от работы

4.   Качество обслуживания

5.   Скорость обслуживания.


Следующей важной задачей является классификация объектов или людей. При этом используются данные о реальной и смоделированной совокупности.


Действительный статус

Всего

Предположит. стат.

 

 

Не явл-ся пос-м

Явл-ся посм

Не является посетителем

117

94 (80,3 %)

23 (19,7 %)

Является посетителем

296

61 (20,6 %)

235 (79,4 %)

Всего

413

 

 


Данные свидетельствуют о том, что 80,3 % из числа лиц, не являющихся посетителями, отнесены к той же группе, а 19,7 % ошибочно были отнесены к посетителям.

Проблема в том, чтобы определить, являются ли данные моделирования достаточными для принятия решения. При этом для оценки используются критерии случайной пропорциональности:

с= р2 + (1 - р)2


р- доля лиц, попавших в группу 1

(1 - р) - доля лиц, попавших в группу 2.


Мы правильно классифицировали 80,3 %, т.о. наша модель позволяет классифицировать людей на посетителей и непосетителей.


Кластерный анализ.

 

Используется для технических процедур; используется для классификации людей и объектов по нескольким признакам одновременно. Цель - объединить объекты так, чтобы в одну группу попали насколько возможно однородные объекты и чтобы различные группы отличались существенно между собой.


Существует несколько процедур кластеризации, но все они базируются на использовании мер или критериев близости. Наиболее распространенным критерием близости является среднеквадратическая разность.


Евклидово расстояние - расстояние между объектами


d (Xi; Xj) = [å (Xik - Xjk)2 ]2


Суть в том, что последовательно объединяются объекты сначала более близкие, а затем все более отдаленные друг от друга. Работа алгоритма заканчивается, когда все объекты будут объединены в один класс. Результатом обычно является графическое изображение, иллюстрирующее вид иерархического дерева (дендрограмма).


Описанный алгоритм не имеет четких правил остановки на каком-то этапе кластеризации. Обычно исследователи принимают во внимание устойчивость групп на протяжении нескольких шагов алгоритма. В кластерном анализе не рекомендуется использовать большое количество факторов. Существует зависимость между количеством объектов и количеством факторов.


               lg n

L max = lg 2

 

Иногда используются многомерные средние (объединение нескольких признаков в общий).


Факторный анализ.


Факторный анализ - это процедура упрощения исходных данных через  сокращение переменных до меньшего числа факторов. Целью является сводка информации, содержащей большое количественных оценок, меньшее число суммарных величин, называемых факторами. Нет зависимых переменных (как и в кластерном анализе), скомбинировать число переменных.

 

Техническое определение факторов - линейная комбинация переменных. Рассчитывается факторное множество для каждого субъекта в группе данных, при этом каждой переменной соответствует определенный вес в соотношении с тем, сколько она вносит в вариацию каждого фактора.

Страницы: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10



2012 © Все права защищены
При использовании материалов активная ссылка на источник обязательна.