Промышленный лизинг Промышленный лизинг  Методички 

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 [ 169 ] 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223 224 225 226 227 228 229 230 231 232 233 234 235 236 237 238 239 240 241 242 243 244 245 246 247 248 249 250 251 252 253 254 255 256 257 258 259 260 261 262 263 264 265 266 267 268 269 270 271 272 273 274 275 276 277 278 279 280 281 282 283 284 285 286 287 288 289 290 291 292

3. Внутренний диаметр цилиндра является нормально распределенной случайной величиной с математическим ожиданием 1 дюйм и стандартным отклонением 0,01 дюйма. При сборке внутрь каждого цилиндра вставляется твердый стержень. Диаметр стержня является нормально распределенной случайной величиной с математическим ожиданием 0,99 и стандартным отклонением 0,01 дюйма. Требуется определить процент пар цилиндр-стержень, которые не подойдут для сборки. (Подсказка. Разность двух нормально распределенных случайных величин также является нормально распределенной величиной.)

12.5. ЭМПИРИЧЕСКИЕ РАСПРЕДЕЛЕНИЯ

В предыдущих разделах мы рассмотрели свойства плотностей вероятностей, функции распределения случайных величин и привели примеры четырех типов распределений. Как определяются эти распределения на практике?

Определение (или, точнее, оценка) любой плотности вероятности случайной величины содержится в необработанной информации, которая собирается в процессе изучения исследуемой ситуации. Например, для оценки плотности вероятности времени между приходом покупателей в бакалейную лавку, сначала фиксируется время их прихода. Искомое время между приходом покупателей находится путем вычитания времен последовательных их приходов.

В этом разделе мы рассмотрим, как собранные данные (именуемые статистическим рядом или выборкой) можно преобразовать в плотность вероятности случайных величин с помощью следующих шагов.

Шаг 1. Отображаем данные в виде подходящей частотной гистограммы и подбираем эмпирическую функцию плотности вероятности.

Шаг 2. Используем критерий согласия, чтобы проверить, совпадает ли полученная эмпирическая функция плотности вероятности с одной из известных плотностей вероятностей.

Рассмотрим детали этой процедуры.

Гистограмма частот. Данная гистограмма строится на основе статистического ряда (выборки) путем деления области изменения исходных данных (от минимального до максимального значения) на непересекающиеся интервалы. При заданных границах (/, /,) интервала i соответствующая частота определяется как число выборочных значений х, которые удовлетворяют неравенству <x<It.

Пример 12.5.1

Данные, приведенные в следующей таблице, представляют время обслуживания (в минутах) 60 посетителей в некотором сервисном центре.

10,6

11,7



Минимальное и максимальное значения приведенных данных соответственно равны 0,2 и 11,7. Поэтому выбираем двенадцать интервалов длиной в 1 минуту (полный интервал изменений равен [0,12]). Надлежащий выбор размера интервала является решающим фактором в определении формы эмпирического распределения. Хотя не существует жестких правил выбора оптимального размера интервала, общим правилом, которого следует придерживаться, является выбор от 10 до 20 интервалов. На практике было бы неплохо попробовать различные размеры интервала для построения подходящей гистограммы.

Приведенная ниже таблица суммирует информацию для рассматриваемого статистического ряда, необходимую для построения гистограммы. Столбец относительной частоты /, вычисляется путем деления соответствующих значений столбца частоты о, на общий объем наблюдений (п = 60). Например Д = 11/60= 0,1833. Значения Ft в столбце накопленных частот вычисляются посредством последовательного суммирования величин ft. Так, F1 = fl= 0,1833 и F2= F1 + f2 = = 0,1833 + 0,1333 = 0,3166.

Интервал

Подсчет наблюдений

Частота, о,

Относительная частота, f,

Накопленная

относительная частота, F,

(0, 1)

4Ш--ШН

0,1833

0,1833

(1.2)

-ШИП

0,1333

0,3166

(2,3)

ш НИ

0,1500

0,4666

(3,4)

Ш II

0,1167

0,5833

(4, 5)

0,1000

0,6833

(5,6)

0,0833

0,7666

(6,7)

IIII

0,0667

0,8333

(7,8)

0,0333

0,8666

(8,9)

0,0500

0,9166

(9, Ю)

0,0500

0,9666

(10, 11)

0,0167

0,9833

(11,12)

0,0167

1,0000

Всего

1,0000

Величины и Ft являются дискретными эквивалентами плотности вероятности и функции распределения времени обслуживания t. Так как гистограмма частот дает дискретную версию непрерывного времени обслуживания, можно преобразовать дискретную функцию распределения в непрерывную кусочно-линейную функцию, соединяя полученные точки отрезками прямых. На рис. 12.6 представлена эмпирическая плотность вероятности и функция распределения для рассматриваемого примера. Здесь функция распределения оценивается в средних точках интервалов значений.

Теперь можно оценить математическое ожидание Г и дисперсию sf эмпирического распределения. Пусть N- число интервалов в гистограмме; обозначим через \ среднюю точку интервала L Тогда




Плотность вероятности

Функция распределения

0 123456789 10 11 12 ((минуты)

Рис. 12.6. Эмпирическая плотность вероятности и функция распределения

Применяя эти формулы для рассматриваемого примера, получаем следующее. Т = 0,1833 х 0,5 + 0,133 х 1,5 + ... + 0,0167х 11,5 = 3,934 минуты,

s; =0,1833 х (0,5-3,934)2 + 0,133 х (1,5-3,934)2 + ... + 0,0167 х (11,5 - 3.934)2 = 8,646 минут2.

Построение гистограмм в Excel. Электронная таблица Excel имеет встроенные средства для построения гистограмм. Для этого выберите команду Сервис=>Анализ данныхГистограмма и в открывшемся диалоговом окне введите необходимые данные3. Средство Гистограмма непосредственно не вычисляет среднее и стандартное отклонение4. Поэтому предлагаемый шаблон chllSampleMeanVar.xls разработан таким образом, что в нем автоматически вычисляются среднее, дисперсия, максимальное и минимальное значения, также как имеется возможность применить средство Excel Гистограмма5.

На рис. 12.7 видно, что входные данные примера 12.5.1 записаны в диапазоне А8:Е19. После того как данные будут внесены в рабочий лист, шаблон автоматически подсчитает простые статистические характеристики (среднее, стандартное отклонение, минимум и максимум).

Для построения гистограммы сначала надо ввести верхние границы интервалов в столбец F, начиная со строки 8. В нашем примере эти границы введены в диапазон F8:F19. В диалоговом окне Гистограмма надо указать местоположение выбо-

Команда СервисАнализ данных будет доступна только тогда, когда к Excel присоединена надстройка Пакет анализа, которая автоматически не присоединяется при установке Excel. Чтобы присоединить эту надстройку, выберите команду Сервисе Надстройки и в диалоговом окне Надстройки установите флажок Пакет анализа. - Прим. ред.

4 В диалоговом окне Анализ данных предлагается много различных средств статистического анализа. В частности, средство Описательная статистика можно использовать для вычисления среднего и стандартного отклонения (даже если остальные выходные результаты этого средства вы использовать не будете).

Рабочая книга chllSampleMeanVar.xls защищена от изменений, поэтому она не руси-

фицирована. Данные, вычисляемые в этом шаблоне, легко получить с помощью встроенных функций Excel СРЗНАЧ, ДИСП, МАКС, МИН и других. - Прим. ред.



1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 [ 169 ] 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223 224 225 226 227 228 229 230 231 232 233 234 235 236 237 238 239 240 241 242 243 244 245 246 247 248 249 250 251 252 253 254 255 256 257 258 259 260 261 262 263 264 265 266 267 268 269 270 271 272 273 274 275 276 277 278 279 280 281 282 283 284 285 286 287 288 289 290 291 292