This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision | ||
courses:statistical_methods_of_experimental_data_handling:coursework [2021/04/06 10:47] andrey.suchkov [Кластерный анализ] |
— (current) | ||
---|---|---|---|
Line 1: | Line 1: | ||
- | ====== Курсовая работа: Программная реализация и компьютерное исследование алгоритмов обработки экспериментальных данных ====== | ||
- | |||
- | ===== Исходные данные ===== | ||
- | Из представленной генеральной совокупности формируется выборка заданного объема по одному из представленных в таблице признаков. Необходимо провести выравнивание статистических рядов, выполнить корреляционный, регрессионный и кластерный анализы. | ||
- | |||
- | ===== Требования к пояснительной записке ===== | ||
- | - Объём пояснительной записки -- не менее 20 страниц (приложения в этот объём не входят). | ||
- | - Количество использованных источников -- не менее 10, причём из них не более 20-25% могут составлять электронные ресурсы. | ||
- | - **Запрещено ссылаться на Википедию!** | ||
- | - Объём введения и заключения -- не менее половины страницы. | ||
- | - В пояснительной записке должно быть не менее 3-ёх разделов, каждый из которых должен содержать не менее 2-ух подразделов. | ||
- | |||
- | ===== Порядок выполнения курсовой работы ===== | ||
- | ==== Выравнивание статистических рядов ==== | ||
- | - Из представленной генеральной совокупности формируется выборка заданного объема по одному из представленных в таблице признаков. | ||
- | - Дальнейшая работа заключается в выполнении следующих пунктов: | ||
- | - Построение ранжированного ряда. | ||
- | - Разбиение на интервалы. | ||
- | - Составление интервального ряда. | ||
- | - Построение полигона частот. | ||
- | - Построение гистограммы. | ||
- | - Построение эмпирической функции распределения. | ||
- | - Построение кумуляты. | ||
- | - Нахождение выборочных оценок: выборочной средней, выборочной дисперсии, исправленной выборочной дисперсия, выборочного СКВО, асимметрии и эксцесса. | ||
- | - Нахождение выборочных оценок медианы, моды и коэффициента вариации | ||
- | - Построение доверительных интервалов для математического ожидания и СКО. | ||
- | - Проверка гипотезы о нормальном законе по критерию Пирсона. | ||
- | <note important>При вычислении точечных выборочных оценок параметров распределения использовать переход к условным вариантам.</note> | ||
- | |||
- | ==== Корреляционный и регрессионный анализ ==== | ||
- | - Из представленной генеральной совокупности формируется выборка заданного объема по второму из представленных в таблице признаков. | ||
- | - Для полученной выборки для второго признака выполнить все действия (согласно п. <<Выравнивание статистических рядов>>), необходимые для получения статистических оценок параметров распределения второго признака. | ||
- | - Для системы двух случайных величин сформировать двумерную выборку и выполнить следующие действия: | ||
- | - Построить корреляционную таблицу. | ||
- | - Найти оценку коэффициента корреляции. | ||
- | - Построить доверительный интервал для коэффициента корреляции. | ||
- | - Осуществить проверку гипотезы о равенстве коэффициента корреляции нулю. | ||
- | - Построить уравнения выборочных прямых среднеквадратической регрессии. Полученные функции регрессии отобразить графически (на одном графике). | ||
- | - Найти оценки корреляционных отношений. | ||
- | - Построить уравнения выборочных кривых для параболической среднеквадратической регрессии, а также уравнение кривой, в зависимости от заданного варианта. Полученные функции регрессии отобразить графически (на одном графике). | ||
- | - Экспоненциальная функция -- $ y = \beta_0\exp(\beta_1x) $ | ||
- | - Логарифмическая функция -- $ y = \beta_1\ln x + \beta_0 $ | ||
- | - Степенная функция -- $ y = \beta_0x^{\beta_1} $ | ||
- | - Дробно-линейная функция -- $ y = \cfrac1{\beta_1x + \beta_0} $ | ||
- | - Обратно пропорциональная функция -- $ y = \cfrac{\beta_1}x + \beta_0 $ | ||
- | - Дробно-рациональная функция: $ y = \cfrac x{\beta_1x + \beta_0} $ | ||
- | - //Дополнительное необязательное задание: Вычислить следующие показатели качества регрессии для каждой кривой и сделать выводы:// | ||
- | - //теоретический коэффициент детерминации $ R^2 $;// | ||
- | - //средняя квадратическая ошибка $ S_{\varepsilon} $;// | ||
- | - //средняя ошибка аппроксимации (приближения) $ A $.// | ||
- | <note important>Как и в предыдущем разделе, при вычислении точечных выборочных оценок параметров распределения второго признака и коэффициента корреляции использовать переход к условным вариантам.</note> | ||
- | |||
- | ==== Кластерный анализ ==== | ||
- | - Нормализовать множество точек из предыдущего раздела, отобразить полученное множество. | ||
- | - Определить верхнюю оценку количества кластеров: $ \bar k = \lfloor\sqrt{N/2}\rfloor $, где $ N $ -- число точек. | ||
- | - Реализовать алгоритм k-means. Отобразить полученные кластеры, выделить каждый кластер разным цветом, отметить центроиды. | ||
- | - Реализовать метод поиска сгущений. Отобразить полученные кластеры, выделить каждый кластер разным цветом, отметить центроиды. | ||
- | - Проверить чувствительность метода поиска сгущений к погрешностям. Сделать выводы. | ||
- | - Сравнить методы. Сделать выводы. | ||
- | - //Дополнительные необязательные задания:// | ||
- | - //Реализовать алгоритмы k-medians и k-medoids. Отобразить полученные кластеры, выделить каждый кластер разным цветом, отметить центроиды.// | ||
- | - //С помощью метода локтя и/или метода силуэтов выявить для каждого метода оптимальное количество кластеров. На основании оценки качества разбиения определить наилучший метод кластеризации.// | ||
- | - //Реализовать модификацию k-means++. Объяснить её приемущества. Сравнить с обычным методом k-means.// | ||
- | |||
- | ===== Содержание пояснительной записки ===== | ||
- | - Теоретическую справку о решаемых задачах и методах их решения. | ||
- | - Отображение промежуточных и конечных результатов производимой при решении поставленных задач вычислительной работы с необходимыми комментариями. | ||
- | - Необходимую графическую иллюстрацию получаемых промежуточных и конечных результатов. | ||
- | - Краткое описание используемых в работе программных продуктов. | ||
- | - Содержательные выводы по полученным результатам. | ||
- | - Список использованной литературы. | ||
- | - Приложения с листингами разработанных студентом программ и кратким описанием запрограммированных в них алгоритмов. | ||
- | |||
- | <note important> | ||
- | * Оформление отчета осуществляется в соответствии с университетскими требованиями к оформлению отчетов по курсовым работам и предоставляются преподавателю на проверку в электронном виде в системе Moodle. | ||
- | * Курсовая работа считается выполненной после выполнения студентом всех предусмотренных в ней заданий и устранения всех замечаний преподавателя. | ||
- | * Защита курсовой работы осуществляется в форме выборочного опроса студента преподавателем по тематике и результатам выполненных работ. | ||
- | </note> | ||