====== Программа ====== ===== 1. Введение в анализ данных ===== - Проблема обработки данных - Матрица данных - Гипотеза компактности и скрытых факторов - Структура матрицы данных и задачи обработки - Матрица объект-объект и признак-признак, расстояние и близость - Изменение признаков - Основные типы шкал ===== 2. Классификация данных ===== - Постановка задачи - Статистические методы классификации - Постановка задачи классификации как статистической задачи при известных вероятностных распределениях - Построение классификации для нормального распределения - Числовые примеры - Оценка качества классификации - Классификация на основе оценки апостериорной вероятности - Классификация двух нормальных распределений с неравными матрицами ковариаций - Классификация нормально распределённых векторов при неизвестных параметрах распределения - Задача статистической классификации для количества классов больше 2 - Линейная дискриминантная функция Фишера ===== 3. Обучаемые классификаторы. Детерминистский подход ===== - Общие свойства линейных дискриминантных функций в детерминистской подстановке - Персептронный алгоритм получения линейных решающих правил - Правила поиска решения, основанные на минимизации градиента функции качества - Формальный вывод персептронного алгоритма ===== 4. Кластерный анализ ===== - Постановка задачи группировки данных - Пример - Критерии качества разбиения на классы - Основные типы кластерных процедур. Основные задачи кластерного анализа - Построение последовательной процедуры итеративной оптимизации - Базовая процедура кластеризации (базовая минимальная квадратичная ошибка) - Параллельная процедура. Базовые изоданные - Описание процедуры: Базовые изоданные - Алгоритм k-внутригрупповых средних - Иерархические процедуры группировки - Агломеративная процедура - Статистические модели группировки - Алгоритм автоматической классификации на основе использования кластер-анализа ===== 5. Методы снижения размерности ===== - Методы отбора признаков по заданному критерию - Метод главных компонент ===== 6. Факторный анализ ===== - Модель факторного анализа - Структура факторных уравнений - Неоднозначность факторного решения - Метод главных факторов - Метод центроидных факторов ===== 7. Многомерное шкалирование ===== - Дистанционная модель для различий - Модель Торгерсона - Поворот - Объективные повороты - Ручные повороты - Размерность - Интерпретация