courses:statistical_methods_of_experimental_data_handling:coursework

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
courses:statistical_methods_of_experimental_data_handling:coursework [2021/04/06 11:13]
andrey.suchkov [Выравнивание статистических рядов]
— (current)
Line 1: Line 1:
-====== Курсовая работа:​ Программная реализация и компьютерное исследование алгоритмов обработки экспериментальных данных ====== 
- 
-===== Исходные данные ===== 
-Из представленной генеральной совокупности формируется выборка заданного объема по одному из представленных в таблице признаков. Необходимо провести выравнивание статистических рядов, выполнить корреляционный,​ регрессионный и кластерный анализы. 
- 
-===== Требования к пояснительной записке ===== 
-  - Объём пояснительной записки -- не менее 20 страниц (приложения в этот объём не входят). 
-  - Количество использованных источников -- не менее 10, причём из них не более 20-25% могут составлять электронные ресурсы. 
-  - **Запрещено ссылаться на Википедию!** 
-  - Объём введения и заключения -- не менее половины страницы. 
-  - В пояснительной записке должно быть не менее 3-ёх разделов,​ каждый из которых должен содержать не менее 2-ух подразделов. 
- 
-===== Порядок выполнения курсовой работы ===== 
-==== Выравнивание статистических рядов ==== 
-  - Из представленной генеральной совокупности формируется выборка заданного объема по одному из представленных в таблице признаков. 
-  - Дальнейшая работа заключается в выполнении следующих пунктов:​ 
-    - Построение ранжированного ряда. 
-    - Разбиение на интервалы. 
-    - Составление интервального ряда. 
-    - Построение полигона частот. 
-    - Построение гистограммы. 
-    - Построение эмпирической функции распределения. 
-    - Нахождение выборочных оценок:​ выборочной средней,​ выборочной дисперсии,​ исправленной выборочной дисперсия,​ выборочного СКВО, асимметрии и эксцесса. 
-    - Нахождение выборочных оценок медианы и моды. 
-    - Построение доверительных интервалов для математического ожидания и СКО. 
-    - Проверка гипотезы о нормальном законе по критерию Пирсона. 
-<note important>​При вычислении точечных выборочных оценок параметров распределения использовать переход к условным вариантам.</​note>​ 
- 
-==== Корреляционный и регрессионный анализ ==== 
-  - Из представленной генеральной совокупности формируется выборка заданного объема по второму из представленных в таблице признаков. 
-  - Для полученной выборки для второго признака выполнить все действия (согласно п. <<​Выравнивание статистических рядов>>​),​ необходимые для получения статистических оценок параметров распределения второго признака. 
-  - Для системы двух случайных величин сформировать двумерную выборку и выполнить следующие действия:​ 
-    - Построить корреляционную таблицу. 
-    - Найти оценку коэффициента корреляции. 
-    - Построить доверительный интервал для коэффициента корреляции. 
-    - Осуществить проверку гипотезы о равенстве коэффициента корреляции нулю. 
-    - Построить уравнения выборочных прямых среднеквадратической регрессии. Полученные функции регрессии отобразить графически (на одном графике). 
-    - Найти оценки корреляционных отношений. 
-    - Построить уравнения выборочных кривых для параболической среднеквадратической регрессии $ y = \beta_2x^2 + \beta_1x + \beta_0 $, а также уравнение кривой,​ в зависимости от заданного варианта. Полученные функции регрессии отобразить графически (на одном графике):​ 
-      - Экспоненциальная функция -- $ y = \beta_0\exp(\beta_1x) $ 
-      - Логарифмическая функция -- $ y = \beta_1\ln x + \beta_0 $ 
-      - Степенная функция -- $ y = \beta_0x^{\beta_1} $ 
-      - Дробно-линейная функция -- $ y = \cfrac1{\beta_1x + \beta_0} $ 
-      - Обратно пропорциональная функция -- $ y = \cfrac{\beta_1}x + \beta_0 $ 
-      - Дробно-рациональная функция:​ $ y = \cfrac x{\beta_1x + \beta_0} $ 
-    - //​Дополнительное необязательное задание:​ Вычислить следующие показатели качества регрессии для каждой кривой и сделать выводы://​ 
-      - //​теоретический коэффициент детерминации $ R^2 $;// 
-      - //​средняя квадратическая ошибка $ S_{\varepsilon} $;// 
-      - //​средняя ошибка аппроксимации (приближения) $ A $.// 
-<note important>​Как и в предыдущем разделе,​ при вычислении точечных выборочных оценок параметров распределения второго признака и коэффициента корреляции использовать переход к условным вариантам.</​note>​ 
- 
-==== Кластерный анализ ==== 
-  - Нормализовать множество точек из предыдущего раздела,​ отобразить полученное множество. 
-  - Определить <<​грубую>>​ верхнюю оценку количества кластеров:​ $ \bar k = \lfloor\sqrt{N/​2}\rfloor $, где $ N $ -- число точек. 
-  - Реализовать алгоритм k-means в двух вариантах: ​ 
-    - пересчет центра кластера осуществляется после каждого изменения его состава;​ 
-    - пересчет центра кластера осуществляется лишь после того, как будет завершен просмотр всех данных (шаг процедуры). 
-  - На каждом шаге процедуры разбиения методом k-means вычислять функционалы качества полученного разбиения:​ 
-    - $ F_1 $ -- сумма по всем кластерам квадратов расстояний элементов кластеров до центров соответствующих кластеров;​ 
-    - $ F_2 $ -- сумма по всем кластерам внутрикластерных расстояний между элементами кластеров;​ 
-    - $ F_3 $ -- сумма по всем кластерам внутрикластерных дисперсий (относительно центров кластеров). 
-  - Отобразить полученные кластеры,​ выделить каждый кластер разным цветом,​ отметить центроиды. 
-  - Реализовать метод поиска сгущений. Отобразить полученные кластеры,​ выделить каждый кластер разным цветом,​ отметить центроиды. 
-  - Проверить чувствительность метода поиска сгущений к погрешностям. Сделать выводы. 
-  - Сравнить методы. Сделать выводы. 
-  - //​Дополнительные необязательные задания://​ 
-    - //​Реализовать алгоритмы k-medians и k-medoids. Отобразить полученные кластеры,​ выделить каждый кластер разным цветом,​ отметить центроиды.//​ 
-    - //С помощью метода локтя и/или метода силуэтов выявить для каждого метода оптимальное количество кластеров. На основании оценки качества разбиения определить наилучший метод кластеризации.//​ 
-    - //​Реализовать модификацию k-means++. Объяснить её приемущества. Сравнить с обычным методом k-means.// 
- 
-===== Содержание пояснительной записки ===== 
-  - Теоретическую справку о решаемых задачах и методах их решения. 
-  - Отображение промежуточных и конечных результатов производимой при решении поставленных задач вычислительной работы с необходимыми комментариями. 
-  - Необходимую графическую иллюстрацию получаемых промежуточных и конечных результатов. 
-  - Краткое описание используемых в работе программных продуктов. 
-  - Содержательные выводы по полученным результатам. 
-  - Список использованной литературы. 
-  - Приложения с листингами разработанных студентом программ и кратким описанием запрограммированных в них алгоритмов. 
- 
-<note important>​ 
-  * Оформление отчета осуществляется в соответствии с университетскими требованиями к оформлению отчетов по курсовым работам и предоставляются преподавателю на проверку в электронном виде в системе Moodle. 
-  * Курсовая работа считается выполненной после выполнения студентом всех предусмотренных в ней заданий и устранения всех замечаний преподавателя. 
-  * Защита курсовой работы осуществляется в форме выборочного опроса студента преподавателем по тематике и результатам выполненных работ. 
-</​note>​ 
  
courses/statistical_methods_of_experimental_data_handling/coursework.1617707612.txt.gz · Last modified: 2022/12/10 09:08 (external edit)