Материалы Международной студенческой научной конференции
Студенческий научный форум 2020

РЕГРЕССИОННЫЙ АНАЛИЗ ДЛЯ РЕШЕНИЯ ПРАКТИЧЕСКИХ ЗАДАЧ

Котенко Н.С. 1 Маргаринт А.О. 1
1 ФГБОУ ВО «Донской Государственный Технический Университет»
1. Задачи, решаемые корреляционно-регрессионным анализом – 2016 [Электронный ресурс]: https://studopedia.ru/3_185849_zadachi-reshaemie-korrelyatsionno-regressionnim-analizom.html.
2. Регрессионный анализ – 2018 [Электронный ресурс]: https://math.semestr.ru/corel/regression-analysis.php.
3. Орлов А.И. Эконометрика: учебник для вузов / А.И. Орлов. – Ростов-на-Дону: Феникс, 2009. – 398 с.

В статье рассматриваются теоретические и практические расчеты для решения задач практического назначения с помощью регрессионного анализа. Регрессионный анализ – метод моделирования измеряемых данных и исследование их свойств. Данные для анализа состоят из пар значений зависимой переменной и независимой переменной [1, 2].

Регрессионный анализ позволяет обнаружить скрытые зависимости и представить их в виде математических выражений. Основные цели регрессионного анализа: управление, предсказание, объяснение [3].

С помощью регрессионного анализа можно исследовать: эффективность работы организации, успеваемость школьника (студента), уровень жизни населения РФ (по городам), уровень загрязнения окружающей среды.

Главное достоинство регрессионного анализа в том, что мы получаем качественную модель с адекватным прогнозом, затратив при этом минимум времени.

Задачами регрессионного анализа является: установление формы зависимости, определение функции регрессии и оценка неизвестных значений.

Решение задач основывается на анализе статистических данных, в которых всегда присутствуют определённые отклонения (ошибки). Поэтому существуют специальные методы оценки как уравнения регрессии в целом, так и отдельных ее параметров.

Парная регрессия – уравнение связи двух переменных y и x: y = f(x), где y – результативный признак; x – признак-фактор.

Уравнение линейной регрессии (1).

y = a + bx. (1)

Построение уравнения регрессии сводится к минимизации суммы квадратов отклонения фактических значений результативного признака kotenKO01.wmf от теоретической y (2).

kotenKO03.wmf (2)

Далее, вычислим значения a и b решив систему линейных уравнений (3).

koten01.wmf (3)

Решение системы линейных уравнений (3) соответствует (4).

kotenKO04.wmf (4)

kotenKO05.wmf

Тесноту связей оценивает коэффициент парной корреляции rxy в интервале –1 ≤ rxy ≤ 1.

kotenKO06.wmf (5)

Средняя ошибка аппроксимации, даёт оценку качества построенной модели:

kotenKO07.wmf (6)

Fфакт определяется, как соотношение факторной и остаточной дисперсии, рассчитывается по формуле (7).

kotenKO08.wmf (7)

Fтабл – это возможное значение под влиянием случайных факторов.

Если Fтабл < Fфакт, то гипотеза признаётся, как статистически значима (надежна).

Если Fтабл > Fфакт, то гипотеза характеризуется, как ненадежная (незначимая).

Перейдём к решению задачи.

Решим задачу с помощью регрессионного анализа, используя теоретические данные таблице, где y – заработная плата, x – расходы.

В ходе решения будет использовать формула (1) и (4):

kotenKO09.wmf;

a = 60.4 + 0.08•52.7 ≈ 64.62.

Уравнение регрессии выглядит следующим образом (8).

y = 64.62 – 0.08x. (8)

Из уравнения (8) видно: при увеличении заработной платы на одну условную единицу (руб.) доля расходов снижается на 0.08 %.

Рассчитаем линейный коэффициент парной корреляции kotenKO10.wmf, в ходе решения используем формулу (5).

Исходя из полученного результата, можно говорить о тесноте связи между переменными x и y, при rxy = –0.082 – связь умеренная, обратная.

Исходные данные

 

y

x

xy

x^2

y^2

1

70,5

44,2

3116,1

4970,25

1953,64

2

65,8

52,1

3428,18

4329,64

2714,41

3

62,3

60

3738

3881,29

3600

4

58,2

62,4

3631,68

3387,24

3893,76

5

56

47,2

2643,2

3136

2227,84

6

49,8

50,7

2524,86

2480,04

2570,49

Итого

362,6

316,6

19082,02

22184,46

16960,14

Ср.знач.(Итого/n)

60,4

52,7

3180,16

3697,41

2826,69

S

5,82

5,96

     

S^2

33,87

35,52

     

Найдем среднюю ошибку аппроксимации, в ходе решения будем использовать формулу (6):

kotenKO11.wmf

В среднем расчетные значения отклоняются от фактических на 9,7 %.

Для начала найдем коэффициент детерминации: kotenKO13.wmf.

Вычислим Fфакт используя формулу (7):

kotenKO15.wmf

Выявленное значение указывает на то, что необходимо принять статистическую незначимость параметров уравнения.

Таким образом, проанализировав результаты исследования, мы научились решать задачи и убедились в том, что регрессионный анализ дает возможность оценить степень связи между переменными путем вычисления предполагаемого значения переменной на основании нескольких известных значений.


Библиографическая ссылка

Котенко Н.С., Маргаринт А.О. РЕГРЕССИОННЫЙ АНАЛИЗ ДЛЯ РЕШЕНИЯ ПРАКТИЧЕСКИХ ЗАДАЧ // Материалы МСНК "Студенческий научный форум 2020". – 2020. – № 1. – С. 44-46;
URL: http://publish2020.scienceforum.ru/ru/article/view?id=24 (дата обращения: 31.05.2020).

Предлагаем вашему вниманию журналы, издающиеся в издательстве «Академия Естествознания»
(Высокий импакт-фактор РИНЦ, тематика журналов охватывает все научные направления)

«Фундаментальные исследования» список ВАК ИФ РИНЦ = 1.074