courses:data_analysis_and_interpretation:lectures
Содержание
Программа
1. Введение в анализ данных
- Проблема обработки данных
- Матрица данных
- Гипотеза компактности и скрытых факторов
- Структура матрицы данных и задачи обработки
- Матрица объект-объект и признак-признак, расстояние и близость
- Изменение признаков
- Основные типы шкал
2. Классификация данных
- Постановка задачи
- Статистические методы классификации
- Постановка задачи классификации как статистической задачи при известных вероятностных распределениях
- Построение классификации для нормального распределения
- Числовые примеры
- Оценка качества классификации
- Классификация на основе оценки апостериорной вероятности
- Классификация двух нормальных распределений с неравными матрицами ковариаций
- Классификация нормально распределённых векторов при неизвестных параметрах распределения
- Задача статистической классификации для количества классов больше 2
- Линейная дискриминантная функция Фишера
3. Обучаемые классификаторы. Детерминистский подход
- Общие свойства линейных дискриминантных функций в детерминистской подстановке
- Персептронный алгоритм получения линейных решающих правил
- Правила поиска решения, основанные на минимизации градиента функции качества
- Формальный вывод персептронного алгоритма
4. Кластерный анализ
- Постановка задачи группировки данных
- Пример
- Критерии качества разбиения на классы
- Основные типы кластерных процедур. Основные задачи кластерного анализа
- Построение последовательной процедуры итеративной оптимизации
- Базовая процедура кластеризации (базовая минимальная квадратичная ошибка)
- Параллельная процедура. Базовые изоданные
- Описание процедуры: Базовые изоданные
- Алгоритм k-внутригрупповых средних
- Иерархические процедуры группировки
- Агломеративная процедура
- Статистические модели группировки
- Алгоритм автоматической классификации на основе использования кластер-анализа
5. Методы снижения размерности
- Методы отбора признаков по заданному критерию
- Метод главных компонент
6. Факторный анализ
- Модель факторного анализа
- Структура факторных уравнений
- Неоднозначность факторного решения
- Метод главных факторов
- Метод центроидных факторов
7. Многомерное шкалирование
- Дистанционная модель для различий
- Модель Торгерсона
- Поворот
- Объективные повороты
- Ручные повороты
- Размерность
- Интерпретация