Sidebar






Old

courses:data_analysis_and_interpretation:task1

This is an old revision of the document!


Практическая работа №1: Основы работы с языком R

Цель работы

Научиться создавать программы на языке R, формировать и обрабатывать с их помощью статистические данные, а также пользоваться контекстной помощью.

Основные теоретические положения

R – язык программирования для статистической обработки данных и работы с графикой, а также свободная программная среда вычислений с открытым исходным кодом в рамках проекта GNU. R широко используется как статистическое программное обеспечение для анализа данных и фактически стал стандартом для статистических программ. R поддерживает широкий спектр статистических и численных методов и обладает хорошей расширяемостью с помощью пакетов. Пакеты представляют собой библиотеки для работы специфических функций или специальных областей применения. В базовую поставку R включен основной набор пакетов, а всего по состоянию на 2017 год доступно более 11778 пакетов. Ещё одна особенность R – возможность создания качественной графики, которая может включать математические символы.

Постановка задачи

Используя средства языка R провести анализ таблицы данных “Социологический опрос”, получить необходимые результаты, сделать выводы.

Порядок выполнения работы

  1. Создать таблицу данных «Социологический опрос» из 6 случаев и 4 переменных с помощью конструкции data.frame(). Имена переменных задать следующие: name (ФИО), sex (Пол), age (Возраст), education (Образование), income (Доход).
  2. Переменные Пол и Образование представить как факторные. Проверить, что эти переменные действительно факторные любым удобным способом с соответствующим сообщением в консоли.
  3. Добавить в таблицу новую переменную income_20 (Доход_20), значения которой равны Доход + премия в размере 20% от Дохода.
  4. Рассчитать среднее значение Дохода и вывести его на экран.
  5. Используя инструменты R построить столбчатую диаграмму для Возраста и Дохода.
  6. Добавить в таблицу новую переменную income_S (Доход_С), значения которой равны Доход + Доход_20.
  7. Добавить новую переменную income_M (Доход_М). Необходимо найти максимальный доход и для каждого респондента определить, сколько процентов от максимального дохода составляет его доход.
  8. Рассчитать среднее значение дохода в зависимости от пола.
  9. Удалить переменную income_20.
  10. Составить таблицу 1000×3, содержащую в качестве первой переменной значения значения $x_i \in [0,\,2\pi]$ ($x_i$ изменяется с постоянным шагом), в качестве второй – значения $\sin x_i$ и в качестве третьей – значения $\sin x_i + X$, где $X \sim \mathcal N(0,\,0.005)$.
  11. Создать новый dataframe, в котором будут сохранены только первые 100 строк и последние 50 строк таблицы из п. 10.
  12. Используя инструменты R вывести первые 5 строчек датафрейма из п. 11.
  13. Используя инструменты R вывести последние 5 строчек датафрейма из п. 11.
  14. Нарисовать синусоиду, используя данные из п. 10.

Таблица "Социологический опрос"

ФИО Пол Возраст Образование Доход
Петров П. Муж 21 Среднее 125
Комарова И. Жен 23 Высшее 345
Филова Р. Жен 40 - 50
Статистов М. Муж 35 Среднее 399
Ивлева Т. Жен 18 Среднее 136
Часов И. Муж 20 Высшее 120

Содержание отчёта

courses/data_analysis_and_interpretation/task1.1570317797.txt.gz · Last modified: 2022/12/10 09:08 (external edit)