![]() |
![]() |
|
Промышленный лизинг
Методички
оценок параметров были как можно меньше. Это достигается таким выбором значений аир, которые минимизируют сумму квадратов значений ef. Термин линейные просто повторяет, что взаимосвязь линейна. Требование несмещенные означает, что ожидаемые значе-ния коэффициентов регрессии должны являться истинными коэффициентами. Метод, используемый чаще других для нахождения параметров уравнения регрессии и известный как метод наименьших квадратов, дает наилучшие линейные несмещенные оценки. Он называется так потому, что при расчете параметров прямой линии, которая наиболее соответствует фактическим данным, с помощью этого метода стараются найти линию, минимизирующую сумму квадратов значений ошибок или расхождений между величинами Y, которые рассчитаны по уравнению прямой и обозначаются Y , и фактическими наблюдениями. Это показано на рис. 6.2. ![]() Рис. 6.2 Статистические попущения метопа наименьших квадратов Для обоснованного приложения метода наименьших квадратов (МНК) к данным и проверки взаимосвязи между переменными данные должны соответствовать допущениям, предполагаемым регрессионной моделью. Они представляют собой следующее: 1. Математическая форма взаимосвязи между истинной зависимой переменной У и независимой переменной X выглядит как Y = а + $Х + е . (6.2) В данный момент было бы полезным рассмотреть различия между детерминированными* и вероятностными моделями. Детерминированные модели - это те, в которых при известном значении X значения Y также точно известны. Например, доход коммивояжера может быть определен через фиксированный оклад а и премию р% от объема продаж. Как только мы узнаем денежный объем продаж, мы сможем определить Y в точности как Y = а + $Х. Нет необходимости в приложении регрессионного анализа к подобным моделям. Нам просто нужно произвести наблюдение за двумя X и относящимися к ним У и провести линию через эти точки. Чаще мы должны относиться к У как к случайной переменной. При известной величине X мы имеем распределение вероятностей для У, таким образом, модель вероятностна и выражается следующим образом Y = а + $Х + е. По фактическим данным мы оцениваем аир, оценочные значения обозначаются аир соответственно. Можно затем рассчитать ожидаемое значение У, т.е. у , из выражения i = d + рА . (6.3) Следовательно, для каждого значения данных Х( существует фактическое значение У но при использовании выражения (6.3) появляется также оценочное значение Yt. Разность между У/ и У, - это ошибка оценки е,-. Найденная с помощью МНК линия регрессии представляет собой прямую, которая минимизирует сумму квадратов в/, т.е. минимизирует 2 ef = 2(У; - У, )2. 2. Значение ошибки е,- нормально распределено со средней, равной нулю, и постоянной дисперсией о2, что часто записывается как е,~М0, о2). 3. Последующие значения ошибок независимы друг от друга, т.е. ковариация в парах значений ошибок равна нулю (cov e,ej = 0). 4. Независимая переменная является нестохастической. Первое допущение просто повторяет, что в данной модели мы имеем дело с линейными зависимостями, и что величины зависимой переменной Y определяются только одним значимым фактором - независимой переменной X. Второе допущение указывает, что хотя существует только один главный фактор (Л), определяющий величину Y, присутствует также множество второстепенных факторов, некоторые из них будут оказывать положительное влияние на величину Y, а другие отрицательное. В случае множества отрицательных и положительных влияний значение ошибки будет нормально распределено. Допущение о постоянной дисперсии значения ошибки означает, что как бы ни была велика или мала величина независимой переменной X, разброс значений е постоянен. Говорят, что значение ошибки обладает свойством гомоскеда-стичности. Если разброс значений ошибки непостоянен, то ошибки определяются как гетероскедастичные. Третье допущение о том, что значения е независимы друг от друга, просто означает, что второстепенные факторы или факторы, которые послужили причиной ошибки для одной из величин Y, не приводят автоматически к ошибкам для всех наблюдений Y. Когда значения е независимы, данные являются неавтокорре-лированнымн. Если значения е не являются независимыми, говорят, что данные автокоррелированы или демонстрируют наличие автокорреляции. Иногда автокорреляцию называют последовательной корреляцией . Так как Y линейно связана с е, то сама Y - это случайная переменная. Для любых значений Xзначения Убудут нормально распределены, и, таким образом, статистическое распределение Yi может быть полностью описано с помощью его средней и дисперсии: Так как а и Pi постоянны, a Xj нестохастична, это выражение преобразуется в £(У,) = £(а + р,Х, + (6.4) ад)-о + М,+Е(е,). (6.5) Однако поскольку математическое ожидание е, равно нулю, выражение (6.5) превращается в £(У,) = а + р,Х,. (6.6) 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 [ 87 ] 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 |