1. Количество наблюдений N= 100. 2. Среднее значение случайной величины равно 18,781. 3. Геометрическое среднее равно 18,520. Средним геометрическим ряда чисел называется такое число, которым можно заменить каждое из данных чисел так, чтобы их произведение не изменилось. 4. Среднее гармоническое равно 18,3066. Средним гармоническим нескольких положительных чисел называется число, обратное среднему арифметических их обратных. 5. Медиана – значение ВС, которое делит площадь фигуры, ограниченной графиком плотности распределения, пополам. В нашем случае медиана равна 18,55. 6. Мода — значение во множестве наблюдений, которое встречается наиболее часто. В данной совокупности встречается одна мода и она равна 19.1. 7. Сумма всех значений равна 1878,1. 8. Наибольшее значение случайной величины равно 46.4, наименьшее – 14.0. 9. Дисперсией случайной величины называется среднее значение квадрата отклонения случайной величины от её среднего значения. Получаем
10. Среднеквадратическим отклонением случайной величины х называется корень квадратный из дисперсии этой величины. В данном случае он среднеквадратическое отклонение равно 3,6500. 11. Коэффициент вариации равен 19,4347. Коэффициент вариации является отношением среднеквадратического отклонения случайной величины к ее ожидаемому значению. 12. Стандартная ошибка среднего равна 0,3650. Стандартная ошибка среднего в математической статистике — величина, характеризующая стандартное отклонение выборочного среднего, рассчитанное по выборке размера из генеральной совокупности.
Проверим закон распределения:
Получаем:
Гипотеза о том, что исследуемое распределение равномерно, проверена по критерию на уровне значимости 5% и принята.
В результате эксперимента получены данные, записанные в виде статистического ряда. Требуется: а) записать значения результатов эксперимента в виде вариационного ряда; б) найти размах варьирования и разбить его на 9 интервалов; в) построить полигон частот, гистограмму относительных частот и график эмпирической функции распределения; г) найти числовые характеристики выборки x, DB; д) приняв в качестве нулевой гипотезу Н0: генеральная совокупность, из которой извлечена выборка, имеет нормальное распределение, проверить ее, пользуясь критерием Пирсона при уровне значимости а ==0,25; е) найти доверительные интервалы для математического ожидания и среднего квадратичного отклонения при надежности у = 0,9. Решение Записываем исходные данные в порядке возрастания, то есть составляем вариационный ряд.
По таблице распределения Пирсона при уровне значимости и числе степеней свободы находим критическое значение: . Так как , то нет оснований отклонить гипотезу о нормальном распределении генеральной совокупности. Найдём доверительный интервал для математического ожидания при надёжности , то есть при уровне значимости . По таблице распределения Стьюдента при уровне значимости и числе степеней свободы находим критическое значение: . Доверительный интервал:
Доверительный интервал для неизвестной дисперсии нормально распределенной случайной величины с доверительной вероятностью 0,9 можно найти по формуле:
Находим значения из таблицы распределения : , . Получаем: , . Тогда . Задание 2 Представить представленные ниже модели в приведенном виде. Что можно сказать об идентифицируемости модели? Какие из переменных являются эндогенными, а какие из переменных являются экзогенными? В моделях через εt и vt обозначены случайные члены Рассматривается модель «доход – потребление» вида: сt =β0 +β1yt + εt it = γ0 + γ1 yt + γ2 gt-1 +vt yt = сt +it +gt, где сt – объем потребления, it – объем инвестиций, yt - доход, gt – объем государственных расходов в период t. Решение В данной модели эндогенные (объясняемые) переменные: сt – объем потребления; it – объем инвестиций; yt - доход. Экзогенные (объясняющие) переменные: yt, yt-1, ct, it, gt.
Построим граф состояний для структурной формы модели (в круге – эндогенная переменная, в прямоугольнике – экзогенная переменная):
Построим граф состояний для приведенной формы модели:
Задание 3 По имеющимся данным построить модель множественной регрессии. Максимально использовать все факторы, минимально¬ - 2 (хотя незначимые факторы в модели можно опустить). Допускается применять преобразования к исходным переменным (напр. логарифмирование и потенцирование, и т.п.) В отчете должны присутствовать: 1. корреляционное поле между у и количественными факторами 2. значимость коэффициентов и модели в целом, коэффициент детерминации 3. Результаты тестов на наличие гетероскедастичности и автокорреляции остатков 4. Проверка остатков на нормальное распределение. Результаты тестов проинтерпретировать и представить в отчете вместе со скриншотами Statistica. привести вид уравнения регрессии Надо получить статистически адекватную модель.
Имеются данные о деятельности крупнейших компаний США в 1996 году. № п/п Чистый доход, млрд. долл. США, (у) Оборот капитала, млрд. долл. США, (х1) Использованный капитал, млрд.долл. США, (х2) Численность служащих, тыс. чел., (х3) 1 6,6 6,9 83,6 222,0 2 3,0 18,0 6,5 32,0 3 6,5 107,9 50,4 82,0 4 3,3 16,7 15,4 45,2 5 0,1 79,6 29,6 299,3 6 3,6 16,2 13,3 41,6 7 1,5 5,9 5,9 17,8 8 5,5 53,1 27,1 151,0 9 2,4 18,8 11,2 82,3 10 3,0 35,3 16,4 103,0 11 4,2 71,9 32,5 225,4 12 2,7 93,6 25,4 675,0 13 1,6 10,0 6,4 43,8 14 2,4 31,5 12,5 102,3 15 3,3 36,7 14,3 105,0 16 1,8 13,8 6,5 49,1 17 2,4 64,8 22,7 50,4 18 1,6 30,4 15,8 480,0 19 1,4 12,1 9,3 71,0 20 0,9 31,3 18,9 43,0
Решение Вводим исходные данные в MS EXCEL.
Нажимаем Сервис/Анализ данных/Регрессия.
Вводим необходимые данные.
Нажимаем ОК и получаем результат.
Из ячеек В17-В20 выписываем уравнение регрессии: . (1) В ячейку Е10 вводим формулу =FРАСПОБР(0,05;В12;В13) – критическое значение критерия Фишера. В ячейку D21 вводим формулу =СТЬЮДРАСПОБР(0,05;20-3-1) – критическое значение критерия Стьюдента.
По значениям ячеек D17-D20 видим, что t-статистики коэффициентов при Х1 и при Х3 по модулю меньше критического значения tkp = 2,120, то есть эти коэффициенты незначимы. Исключаем фактор Х1.
Исключаем фактор Х3.
Так как все t-статистики по модулю больше критического значения tkp=2,101, то все коэффициенты регрессии значимо отличаются от нуля. Фактическое значение критерия Фишера (17,26) больше критического значения (4,41). Поэтому имеем адекватное исходным данным уравнение: . (2) Множественный коэффициент корреляции: R = 0,700. Значение коэффициента корреляции довольно высоко. Изображаем исходные данные (столбцы Y и Х2) и график линии (2).
+Задание 4 Необходимо представить ВР как декомпозицию тренда и сезонных составляющих. Проверить статистическое качество модели.
Вычисляем средние из 4-хчленных скользящих средних.
Теперь делим факт на сглаженный ряд.
Усредняем коэффициенты сезонности по одноимённым кварталам.
Нормируем коэффициенты сезонности на единицу.
Вот теперь мы выполнили классическую сезонную декомпозицию, то есть получили значения 4-х мультипликативных коэффициентов. Теперь необходимо заняться линейным трендом. Для оценки тренда мы устраним из фактических продаж сезонные колебания, разделив факт на полученное для данного квартала значение.
С помощью Мастера диаграмм (функция Добавить линию тренда) по столбцу I ищем уравнение линейного тренда.
Уравнение линейного тренда: Здесь x – номер квартала.