Точечная диаграмма — это графическое представление, в котором корреляция, существующая между двумя переменными, может быть известна с помощью плоскости Декартов, очень полезный для определения и представления корреляции, которая существует между данными двух переменных исследования, например, взаимосвязь между причина и следствие.
Scatterplots — это представление переменных в декартовой плоскости с использованием количественных данных.
В этой статье вы найдете:
Что такое диаграмма рассеяния и для чего она полезна?
Диаграмма рассеяния — это тип графического представления, в котором можно узнать корреляцию, которая существует между двумя переменными используя декартову плоскость, для этого значения или данные переменных присваиваются осей (X, Y), и каждое пересечение между обеими переменными представляет собой точку на графике плоский.
Объявления
Эти точки вместе отображаются в виде облака точек, которые представляют собой диаграмму рассеивания.
Объявления
Чем полезна диаграмма рассеяния? Эта дисперсионная диаграмма очень полезна для определения и представления корреляции, существующей между данными двух переменных исследования, таких как отношения между причиной и следствием или отношения между причинами.
Этот тип диаграммы Широко применяется в прикладной статистике, как в экономике, так и в маркетинге, поскольку он помогает компаниям понимать важные рыночные данные, хотя область его применения может быть очень разнообразной.
Объявления
Шаги, чтобы сделать диаграмму рассеяния
Хотя создание диаграммы рассеяния — простой процесс, мы должны принять во внимание следующие шаги:
- Определите ситуацию, детерминанты которой вы хотите изобразить на диаграмме.
- Соберите данные об этих факторах, данные должны быть репрезентативными для ситуации, в которой обе переменные должны иметь одинаковое количество выборочных данных.
- Определите переменные, на оси (Y) зависимая переменная, это представляет фактор, поведение которого находится под влиянием другой переменной, причем эта другая является независимой переменной, представленной на оси (X).
- Отобразите значения каждой переменной на графике и отметьте точкой пересечение данных по оси (Y) с данными по оси (X).
- Анализ данных дисперсии, представленных на графике, для определения наличия корреляции.
Линейная корреляция при анализе диаграмм рассеяния
линейные корреляции на диаграммах рассеяния позволяют нам интерпретировать интенсивность, с которой обе переменные связаны друг с другом, В этом смысле корреляция может быть:
Объявления
- положительная корреляция: означает, что обе переменные имеют возрастающее поведение, если одна из них увеличивает и другую.
-
Отрицательная корреляция: в этом представлении при увеличении одной переменной другая уменьшается.
нулевая корреляция: между обеими переменными нет корреляции.
Тем не менее, корреляция идеальна или совершенна поскольку корреляции между обеими переменными имеют одинаково пропорциональное поведение, с коэффициент корреляции равен единице.
Объявления
если мы хотим точно определить коэффициент корреляции, в Excel может добавить формулы по умолчанию «=COEFF.DE.CORREL(…,..)» Вам просто нужно вставить формулу, перетащить данные из первой переменной, поставить запятую, перетащить данные из второй переменной и все.
1. Пример графика рассеяния
В этом примере компания хочет знать зависимость между количеством отработанных часов и количеством бракованной продукции, для этого компания провела учиться 20 недель, указанное последующее наблюдение дало следующие данные:
После того, как необходимые данные определены, переходим к графическому представлению.Для этого необходимо определить, какой из факторов представляет собой зависимую переменную, а какой — независимую переменную.
Мы можем определить, что отработанное время - независимая переменная представлен на оси (X) и дефектные продукты зависимые который всегда отражается на оси (y).
Мы видим данные, представленные на графике:
Как показано на графике, отношения между собранные данные отображаются рассеянными синими точками, каждая точка представляет собой отношение количества отработанных часов и представленных бракованных изделий за неделю.
К добавить линию тренда на график мы можем определить, что На этом графике есть положительная корреляция, потому что с увеличением рабочего времени увеличивается и процент бракованной продукции.
Эта линия тренда представляет собой коэффициент корреляции 0,91.
2. Пример графика рассеяния
В этом случае мы пытаемся узнать, существует ли взаимосвязь между весом и ростом 18 случайно выбранных людей в данной местности следует отметить, что чем больше данных собрано, тем репрезентативнее выборка условий всего населения; Посмотрим данные:
Давайте посмотрим на представление на диаграмме рассеяния:
Как видно на диаграмме, имеется промежуточная положительная корреляция, потому что рост, хотя и влияет на вес, но его частота не очень высока, коэффициент корреляции которого равен 0,59.
Для разработки диаграммы мы можем использовать Microsoft Office Excel в качестве инструмента., мы просто идем на панель инструментов Excel и вставляем диаграмму рассеяния и добавляем к ней необходимые данные.