Processing math: 100%

Инструменты пользователя

Инструменты сайта


courses:data_analysis_and_interpretation:task2

Практическая работа №2: Подготовка статистических данных

Цель работы

Подготовить данные для работы с R на базе искомого набора статистических данных.

Основные теоритические положения

Рассмотрим традиционный способ представления результатов эксперимента – матрицу данных. Пусть исследователь располагает совокупностью из N наблюдений над состоянием исследуемого явления. При этом явление описано набором из n характеристик, значения которых тем или иным способом измерены в ходе эксперимента. Данные характеристики носят название признаков, показателей или параметров. Такая информация представляется в виде двухмерной таблицы чисел X размерности N×n или в виде матрицы X размерности N×n: X=(x11x1jx1nxi1xijxinxN1xNjxNn) Строки матрицы X соответствуют наблюдениям или, другими словами, объектам наблюдения. В качестве объектов наблюдения выступают, например: в социологии – респонденты (анкетируемые люди), в экономике – предприятия, виды продукции и т.д. Столбцы матрицы X соответствуют признакам, характеризующим изучаемое явление. Как правило, это наиболее легко измеряемые характеристики объектов. Например, предприятие характеризуется численностью, стоимостью основных фондов, видом выпускаемой продукции и т.д. Очевидно, что элемент Xij представляет собой значение признака j, измеренное на объекте i. Часто матрица данных X приводится к стандартной форме следующим преобразованием (для элементов матрицы в стандартной форме используется обозначение x): xj=xijˉxjσj, ˉxj=1NNi=1xij, σ2j=1NNi=1(xijˉxj)2,i=1..N,j=1..n, где ˉxj, σ2j – среднее и дисперсия по столбцу с номером j, после которого стандартная матрица X обладает следующими свойствами: ¯xj=1NNi=1xij=0, (σj)2=1NNi=1(xij)2=1,i=1..N,j=1..n. Зачастую признаки, описывающие некоторый объект, имеют существенно различный физический смысл. Это приводит к тому, что величины в различных столбцах исходной матрицы трудно сопоставлять между собой, например, килограмм и метр. Поэтому получение стандартизованной матрицы можно понимать как приведение всех признаков к некоторой единой условной физической величине, выраженной в одних и тех же условных единицах.

Постановка задачи

Выбрав набор данных, одобренный преподавателем, подготовить данные для последующей работы с помощью инструментов R.

Порядок выполнения работы

Содержание отчёта