Проблема обработки данных. Матрица данных. Гипотеза компактности и скрытых факторов.
Структура матрицы данных и задачи обработки. Матрица объект-объект и признак-признак. Расстояние и близость.
Измерение признаков. Отношения и их представление. Основные проблемы измерений.
Основные типы шкал. Проблема адекватности. Классификация данных: общая постановка задачи.
Решающие функции и основные подходы к их построению.
Классификация данных как статистическая задача.
Классификация в случае двух нормальных распределений с равными матрицами ковариаций.
Примеры построения решающих функции для нормальных распределений с равными диагональными матрицами ковариаций.
Ошибки классификации для случая двух нормальных распределений с равными матрицами ковариаций.
Апостриорная вероятность отнесения данных к классу (на основе теоремы Байеса) для случая многомерных нормальных распределений.
Классификация при количестве классов больше двух (нормальное распределение с равными матрицами ковариаций).
Классификация для случая двух нормальных распределений с разными матрицами ковариаций.
Линейный дискриминант Фишера.
Пошаговый дискриминантный анализ.
Кластерный анализ: общая постановка задачи, определение расстояний между объектами и кластерами, критерии кластеризации.
Последовательная процедура итеративной оптимизации в задачах кластер-анализа.
Параллельная процедура кластеризации. Алгоритм k-внутригрупповых средних.
Алгоритм автоматической классификации на основе алгоритма адаптивного выбора подклассов (АВП).
Иерархическая группировка.
Обучаемые классификаторы: детерминистский подход. Вероятность получения линейного разделения классов.
Построение линейных решающих правил персептронного типа – обучение с коррекцией ошибок.
Построение линейных решающих функции методом градиентной минимизации функции качества.
Алгоритмы оценки информативности признаков.
Метод главных компонент для выбора признаков.
Факторный анализ: общая модель.
Структура факторных уравнений. Неоднозначность факторного решения. Метод главных факторов.
Метод центроидных факторов.
Проблема оценки значений факторов и виды факторных моделей.
Оценки общностей и вращение факторов.
Многомерное шкалирование.