courses:statistical_methods_of_experimental_data_handling:prac6

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
courses:statistical_methods_of_experimental_data_handling:prac6 [2021/04/06 11:01]
andrey.suchkov [Постановка задачи]
courses:statistical_methods_of_experimental_data_handling:prac6 [2024/03/01 19:55] (current)
andrey.suchkov [Порядок выполнения работы]
Line 1: Line 1:
-====== ​Лабораторная работа №6: Кластерный анализ. Метод k-средних ======+====== ​Практическая работа №6: Кластерный анализ. Метод k-средних ======
 ===== Цель работы ===== ===== Цель работы =====
-Освоение основных понятий и некоторых методов кластерного анализа,​ в частности,​ метода k-средних.+Освоение основных понятий и некоторых методов кластерного анализа,​ в частности,​ метода k-means.
  
 ===== Постановка задачи ===== ===== Постановка задачи =====
-Дано конечное множество из объектов,​ представленных двумя признаками (в качестве этого множества принимаем исходную двумерную выборку,​ сформированную ранее в лабораторной работе №4). Выполнить разбиение исходного множества объектов на конечное число подмножеств (кластеров) с использованием метода k-means. Полученные результаты содержательно проинтерпретировать.+Дано конечное множество из объектов,​ представленных двумя признаками (в качестве этого множества принимаем исходную двумерную выборку,​ сформированную ранее в практической работе №4). Выполнить разбиение исходного множества объектов на конечное число подмножеств (кластеров) с использованием метода k-means. Полученные результаты содержательно проинтерпретировать.
  
 ===== Порядок выполнения работы ===== ===== Порядок выполнения работы =====
   - Нормализовать множество точек из предыдущего раздела,​ отобразить полученное множество.   - Нормализовать множество точек из предыдущего раздела,​ отобразить полученное множество.
-  - Определить <<​грубую>>​ верхнюю оценку количества кластеров:​ $ \bar k = \lfloor\sqrt{N/​2}\rfloor $, где $ N $ -- число точек.+  - Определить <<​грубую>>​ верхнюю оценку количества кластеров:​ $ \tilde k = \lfloor\sqrt{N/​2}\rfloor $, где $ N $ -- число точек.
   - Реализовать алгоритм k-means в двух вариантах: ​   - Реализовать алгоритм k-means в двух вариантах: ​
     - пересчет центра кластера осуществляется после каждого изменения его состава;​     - пересчет центра кластера осуществляется после каждого изменения его состава;​
Line 19: Line 19:
   - Содержательно проинтерпретировать полученные результаты.   - Содержательно проинтерпретировать полученные результаты.
   - //​Дополнительные необязательные задания://​   - //​Дополнительные необязательные задания://​
-    - //​Реализовать алгоритмы k-medians и k-medoids. Отобразить полученные кластеры,​ выделить каждый кластер разным цветом,​ отметить центроиды. Провести оценку методов,​ сделать выводы.//​ +    - //​Реализовать алгоритмы ​[[https://​en.wikipedia.org/​wiki/​K-medians_clustering|k-medians]] и [[https://​en.wikipedia.org/​wiki/​K-medoids|k-medoids]]. Отобразить полученные кластеры,​ выделить каждый кластер разным цветом,​ отметить центроиды. Провести оценку методов,​ сделать выводы.//​ 
-    - //С помощью метода локтя и/или метода силуэтов выявить для каждого метода оптимальное количество кластеров.//​ +    - //С помощью ​[[https://​en.wikipedia.org/​wiki/​Elbow_method_(clustering)|метода локтя]] и/​или ​[[https://​en.wikipedia.org/​wiki/​Silhouette_(clustering)|метода силуэтов]] выявить для каждого метода оптимальное количество кластеров.//​ 
-    - //​Реализовать модификацию k-means++. Объяснить её приемущества. Сравнить с обычным методом k-means.//+    - //​Реализовать модификацию ​[[https://​en.wikipedia.org/​wiki/​K-means%2B%2B|k-means++]]. Объяснить её приемущества. Сравнить с обычным методом k-means.//
  
 ===== Содержание отчёта ===== ===== Содержание отчёта =====
courses/statistical_methods_of_experimental_data_handling/prac6.1617706912.txt.gz · Last modified: 2022/12/10 09:08 (external edit)