Differences

This shows you the differences between two versions of the page.

--- courses:statistical_methods_of_experimental_data_handling:coursework [2021/04/06 11:13]
andrey.suchkov [Выравнивание статистических рядов]
+++ — (current)
@@ Line 1: / Line 1: @@
-====== Курсовая работа: Программная реализация и компьютерное исследование алгоритмов обработки экспериментальных данных ======
-===== Исходные данные =====
-Из представленной генеральной совокупности формируется выборка заданного объема по одному из представленных в таблице признаков. Необходимо провести выравнивание статистических рядов, выполнить корреляционный, регрессионный и кластерный анализы.
-===== Требования к пояснительной записке =====
-  - Объём пояснительной записки -- не менее 20 страниц (приложения в этот объём не входят).
-  - Количество использованных источников -- не менее 10, причём из них не более 20-25% могут составлять электронные ресурсы.
-  - **Запрещено ссылаться на Википедию!**
-  - Объём введения и заключения -- не менее половины страницы.
-  - В пояснительной записке должно быть не менее 3-ёх разделов, каждый из которых должен содержать не менее 2-ух подразделов.
-===== Порядок выполнения курсовой работы =====
-==== Выравнивание статистических рядов ====
-  - Из представленной генеральной совокупности формируется выборка заданного объема по одному из представленных в таблице признаков.
-  - Дальнейшая работа заключается в выполнении следующих пунктов:
-    - Построение ранжированного ряда.
-    - Разбиение на интервалы.
-    - Составление интервального ряда.
-    - Построение полигона частот.
-    - Построение гистограммы.
-    - Построение эмпирической функции распределения.
-    - Нахождение выборочных оценок: выборочной средней, выборочной дисперсии, исправленной выборочной дисперсия, выборочного СКВО, асимметрии и эксцесса.
-    - Нахождение выборочных оценок медианы и моды.
-    - Построение доверительных интервалов для математического ожидания и СКО.
-    - Проверка гипотезы о нормальном законе по критерию Пирсона.
-<note important>При вычислении точечных выборочных оценок параметров распределения использовать переход к условным вариантам.</note>
-==== Корреляционный и регрессионный анализ ====
-  - Из представленной генеральной совокупности формируется выборка заданного объема по второму из представленных в таблице признаков.
-  - Для полученной выборки для второго признака выполнить все действия (согласно п. <<Выравнивание статистических рядов>>), необходимые для получения статистических оценок параметров распределения второго признака.
-  - Для системы двух случайных величин сформировать двумерную выборку и выполнить следующие действия:
-    - Построить корреляционную таблицу.
-    - Найти оценку коэффициента корреляции.
-    - Построить доверительный интервал для коэффициента корреляции.
-    - Осуществить проверку гипотезы о равенстве коэффициента корреляции нулю.
-    - Построить уравнения выборочных прямых среднеквадратической регрессии. Полученные функции регрессии отобразить графически (на одном графике).
-    - Найти оценки корреляционных отношений.
-    - Построить уравнения выборочных кривых для параболической среднеквадратической регрессии $ y = \beta_2x^2 + \beta_1x + \beta_0 $, а также уравнение кривой, в зависимости от заданного варианта. Полученные функции регрессии отобразить графически (на одном графике):
-      - Экспоненциальная функция -- $ y = \beta_0\exp(\beta_1x) $
-      - Логарифмическая функция -- $ y = \beta_1\ln x + \beta_0 $
-      - Степенная функция -- $ y = \beta_0x^{\beta_1} $
-      - Дробно-линейная функция -- $ y = \cfrac1{\beta_1x + \beta_0} $
-      - Обратно пропорциональная функция -- $ y = \cfrac{\beta_1}x + \beta_0 $
-      - Дробно-рациональная функция: $ y = \cfrac x{\beta_1x + \beta_0} $
-    - //Дополнительное необязательное задание: Вычислить следующие показатели качества регрессии для каждой кривой и сделать выводы://
-      - //теоретический коэффициент детерминации $ R^2 $;//
-      - //средняя квадратическая ошибка $ S_{\varepsilon} $;//
-      - //средняя ошибка аппроксимации (приближения) $ A $.//
-<note important>Как и в предыдущем разделе, при вычислении точечных выборочных оценок параметров распределения второго признака и коэффициента корреляции использовать переход к условным вариантам.</note>
-==== Кластерный анализ ====
-  - Нормализовать множество точек из предыдущего раздела, отобразить полученное множество.
-  - Определить <<грубую>> верхнюю оценку количества кластеров: $ \bar k = \lfloor\sqrt{N/2}\rfloor $, где $ N $ -- число точек.
-  - Реализовать алгоритм k-means в двух вариантах:
-    - пересчет центра кластера осуществляется после каждого изменения его состава;
-    - пересчет центра кластера осуществляется лишь после того, как будет завершен просмотр всех данных (шаг процедуры).
-  - На каждом шаге процедуры разбиения методом k-means вычислять функционалы качества полученного разбиения:
-    - $ F_1 $ -- сумма по всем кластерам квадратов расстояний элементов кластеров до центров соответствующих кластеров;
-    - $ F_2 $ -- сумма по всем кластерам внутрикластерных расстояний между элементами кластеров;
-    - $ F_3 $ -- сумма по всем кластерам внутрикластерных дисперсий (относительно центров кластеров).
-  - Отобразить полученные кластеры, выделить каждый кластер разным цветом, отметить центроиды.
-  - Реализовать метод поиска сгущений. Отобразить полученные кластеры, выделить каждый кластер разным цветом, отметить центроиды.
-  - Проверить чувствительность метода поиска сгущений к погрешностям. Сделать выводы.
-  - Сравнить методы. Сделать выводы.
-  - //Дополнительные необязательные задания://
-    - //Реализовать алгоритмы k-medians и k-medoids. Отобразить полученные кластеры, выделить каждый кластер разным цветом, отметить центроиды.//
-    - //С помощью метода локтя и/или метода силуэтов выявить для каждого метода оптимальное количество кластеров. На основании оценки качества разбиения определить наилучший метод кластеризации.//
-    - //Реализовать модификацию k-means++. Объяснить её приемущества. Сравнить с обычным методом k-means.//
-===== Содержание пояснительной записки =====
-  - Теоретическую справку о решаемых задачах и методах их решения.
-  - Отображение промежуточных и конечных результатов производимой при решении поставленных задач вычислительной работы с необходимыми комментариями.
-  - Необходимую графическую иллюстрацию получаемых промежуточных и конечных результатов.
-  - Краткое описание используемых в работе программных продуктов.
-  - Содержательные выводы по полученным результатам.
-  - Список использованной литературы.
-  - Приложения с листингами разработанных студентом программ и кратким описанием запрограммированных в них алгоритмов.
-<note important>
-  * Оформление отчета осуществляется в соответствии с университетскими требованиями к оформлению отчетов по курсовым работам и предоставляются преподавателю на проверку в электронном виде в системе Moodle.
-  * Курсовая работа считается выполненной после выполнения студентом всех предусмотренных в ней заданий и устранения всех замечаний преподавателя.
-  * Защита курсовой работы осуществляется в форме выборочного опроса студента преподавателем по тематике и результатам выполненных работ.
-</note>

se.moevm.info

User Tools

Site Tools

Differences

Page Tools