User Tools

Site Tools


Sidebar






Old

courses:statistical_methods_of_experimental_data_handling:coursework

This is an old revision of the document!


Курсовая работа: Программная реализация и компьютерное исследование алгоритмов обработки экспериментальных данных

Исходные данные

Из представленной генеральной совокупности формируется выборка заданного объема по одному из представленных в таблице признаков. Необходимо провести выравнивание статистических рядов, выполнить корреляционный, регрессионный и кластерный анализы.

Требования к пояснительной записке

  1. Объём пояснительной записки – не менее 20 страниц (приложения в этот объём не входят).
  2. Количество использованных источников – не менее 10, причём из них не более 20-25% могут составлять электронные ресурсы.
  3. Запрещено ссылаться на Википедию!
  4. Объём введения и заключения – не менее половины страницы.
  5. В пояснительной записке должно быть не менее 3-ёх разделов, каждый из которых должен содержать не менее 2-ух подразделов.

Порядок выполнения курсовой работы

Выравнивание статистических рядов

  1. Из представленной генеральной совокупности формируется выборка заданного объема по одному из представленных в таблице признаков.
  2. Дальнейшая работа заключается в выполнении следующих пунктов:
    1. Построение ранжированного ряда.
    2. Разбиение на интервалы.
    3. Составление интервального ряда.
    4. Построение полигона частот.
    5. Построение гистограммы.
    6. Построение эмпирической функции распределения.
    7. Нахождение выборочных оценок: выборочной средней, выборочной дисперсии, исправленной выборочной дисперсия, выборочного СКВО, асимметрии и эксцесса.
    8. Нахождение выборочных оценок медианы и моды.
    9. Построение доверительных интервалов для математического ожидания и СКО.
    10. Проверка гипотезы о нормальном законе по критерию Пирсона.
При вычислении точечных выборочных оценок параметров распределения использовать переход к условным вариантам.

Корреляционный и регрессионный анализ

  1. Из представленной генеральной совокупности формируется выборка заданного объема по второму из представленных в таблице признаков.
  2. Для полученной выборки для второго признака выполнить все действия (согласно п. «Выравнивание статистических рядов»), необходимые для получения статистических оценок параметров распределения второго признака.
  3. Для системы двух случайных величин сформировать двумерную выборку и выполнить следующие действия:
    1. Построить корреляционную таблицу.
    2. Найти оценку коэффициента корреляции.
    3. Построить доверительный интервал для коэффициента корреляции.
    4. Осуществить проверку гипотезы о равенстве коэффициента корреляции нулю.
    5. Построить уравнения выборочных прямых среднеквадратической регрессии. Полученные функции регрессии отобразить графически (на одном графике).
    6. Найти оценки корреляционных отношений.
    7. Построить уравнения выборочных кривых для параболической среднеквадратической регрессии $ y = \beta_2x^2 + \beta_1x + \beta_0 $, а также уравнение кривой, в зависимости от заданного варианта. Полученные функции регрессии отобразить графически (на одном графике):
      1. Экспоненциальная функция – $ y = \beta_0\exp(\beta_1x) $
      2. Логарифмическая функция – $ y = \beta_1\ln x + \beta_0 $
      3. Степенная функция – $ y = \beta_0x^{\beta_1} $
      4. Дробно-линейная функция – $ y = \cfrac1{\beta_1x + \beta_0} $
      5. Обратно пропорциональная функция – $ y = \cfrac{\beta_1}x + \beta_0 $
      6. Дробно-рациональная функция: $ y = \cfrac x{\beta_1x + \beta_0} $
    8. Дополнительное необязательное задание: Вычислить следующие показатели качества регрессии для каждой кривой и сделать выводы:
      1. теоретический коэффициент детерминации $ R^2 $;
      2. средняя квадратическая ошибка $ S_{\varepsilon} $;
      3. средняя ошибка аппроксимации (приближения) $ A $.
Как и в предыдущем разделе, при вычислении точечных выборочных оценок параметров распределения второго признака и коэффициента корреляции использовать переход к условным вариантам.

Кластерный анализ

  1. Нормализовать множество точек из предыдущего раздела, отобразить полученное множество.
  2. Определить «грубую» верхнюю оценку количества кластеров: $ \bar k = \lfloor\sqrt{N/2}\rfloor $, где $ N $ – число точек.
  3. Реализовать алгоритм k-means в двух вариантах:
    1. пересчет центра кластера осуществляется после каждого изменения его состава;
    2. пересчет центра кластера осуществляется лишь после того, как будет завершен просмотр всех данных (шаг процедуры).
  4. На каждом шаге процедуры разбиения методом k-means вычислять функционалы качества полученного разбиения:
    1. $ F_1 $ – сумма по всем кластерам квадратов расстояний элементов кластеров до центров соответствующих кластеров;
    2. $ F_2 $ – сумма по всем кластерам внутрикластерных расстояний между элементами кластеров;
    3. $ F_3 $ – сумма по всем кластерам внутрикластерных дисперсий (относительно центров кластеров).
  5. Отобразить полученные кластеры, выделить каждый кластер разным цветом, отметить центроиды.
  6. Реализовать метод поиска сгущений. Отобразить полученные кластеры, выделить каждый кластер разным цветом, отметить центроиды.
  7. Проверить чувствительность метода поиска сгущений к погрешностям. Сделать выводы.
  8. Сравнить методы. Сделать выводы.
  9. Дополнительные необязательные задания:
    1. Реализовать алгоритмы k-medians и k-medoids. Отобразить полученные кластеры, выделить каждый кластер разным цветом, отметить центроиды.
    2. С помощью метода локтя и/или метода силуэтов выявить для каждого метода оптимальное количество кластеров. На основании оценки качества разбиения определить наилучший метод кластеризации.
    3. Реализовать модификацию k-means++. Объяснить её приемущества. Сравнить с обычным методом k-means.

Содержание пояснительной записки

  1. Теоретическую справку о решаемых задачах и методах их решения.
  2. Отображение промежуточных и конечных результатов производимой при решении поставленных задач вычислительной работы с необходимыми комментариями.
  3. Необходимую графическую иллюстрацию получаемых промежуточных и конечных результатов.
  4. Краткое описание используемых в работе программных продуктов.
  5. Содержательные выводы по полученным результатам.
  6. Список использованных источников.
  7. Приложения с листингами разработанных студентом программ и кратким описанием запрограммированных в них алгоритмов.
  • Оформление отчета осуществляется в соответствии с университетскими требованиями к оформлению отчетов по курсовым работам и предоставляются преподавателю на проверку в электронном виде в системе Moodle.
  • Курсовая работа считается выполненной после выполнения студентом всех предусмотренных в ней заданий и устранения всех замечаний преподавателя.
  • Защита курсовой работы осуществляется в форме выборочного опроса студента преподавателем по тематике и результатам выполненных работ.
courses/statistical_methods_of_experimental_data_handling/coursework.1617707697.txt.gz · Last modified: 2022/12/10 09:08 (external edit)