−Содержание
Практическая работа №2: Подготовка статистических данных
Цель работы
Подготовить данные для работы с R на базе искомого набора статистических данных.
Основные теоритические положения
Рассмотрим традиционный способ представления результатов эксперимента – матрицу данных. Пусть исследователь располагает совокупностью из N наблюдений над состоянием исследуемого явления. При этом явление описано набором из n характеристик, значения которых тем или иным способом измерены в ходе эксперимента. Данные характеристики носят название признаков, показателей или параметров. Такая информация представляется в виде двухмерной таблицы чисел X размерности N×n или в виде матрицы X размерности N×n: X=(x11…x1j…x1n……………xi1…xij…xin……………xN1…xNj…xNn) Строки матрицы X соответствуют наблюдениям или, другими словами, объектам наблюдения. В качестве объектов наблюдения выступают, например: в социологии – респонденты (анкетируемые люди), в экономике – предприятия, виды продукции и т.д. Столбцы матрицы X соответствуют признакам, характеризующим изучаемое явление. Как правило, это наиболее легко измеряемые характеристики объектов. Например, предприятие характеризуется численностью, стоимостью основных фондов, видом выпускаемой продукции и т.д. Очевидно, что элемент Xij представляет собой значение признака j, измеренное на объекте i. Часто матрица данных X приводится к стандартной форме следующим преобразованием (для элементов матрицы в стандартной форме используется обозначение x′): x′j=xij−ˉxjσj, ˉxj=1NN∑i=1xij, σ2j=1NN∑i=1(xij−ˉxj)2,i=1..N,j=1..n, где ˉxj, σ2j – среднее и дисперсия по столбцу с номером j, после которого стандартная матрица X′ обладает следующими свойствами: ¯x′j=1NN∑i=1x′ij=0, (σ′j)2=1NN∑i=1(x′ij)2=1,i=1..N,j=1..n. Зачастую признаки, описывающие некоторый объект, имеют существенно различный физический смысл. Это приводит к тому, что величины в различных столбцах исходной матрицы трудно сопоставлять между собой, например, килограмм и метр. Поэтому получение стандартизованной матрицы можно понимать как приведение всех признаков к некоторой единой условной физической величине, выраженной в одних и тех же условных единицах.
Постановка задачи
Выбрав набор данных, одобренный преподавателем, подготовить данные для последующей работы с помощью инструментов R.