Инструменты пользователя

Инструменты сайта


courses:data_analysis_and_interpretation:lectures

Программа

1. Введение в анализ данных

  1. Проблема обработки данных
  2. Матрица данных
  3. Гипотеза компактности и скрытых факторов
  4. Структура матрицы данных и задачи обработки
  5. Матрица объект-объект и признак-признак, расстояние и близость
  6. Изменение признаков
  7. Основные типы шкал

2. Классификация данных

  1. Постановка задачи
  2. Статистические методы классификации
    1. Постановка задачи классификации как статистической задачи при известных вероятностных распределениях
    2. Построение классификации для нормального распределения
    3. Числовые примеры
    4. Оценка качества классификации
    5. Классификация на основе оценки апостериорной вероятности
    6. Классификация двух нормальных распределений с неравными матрицами ковариаций
    7. Классификация нормально распределённых векторов при неизвестных параметрах распределения
    8. Задача статистической классификации для количества классов больше 2
    9. Линейная дискриминантная функция Фишера

3. Обучаемые классификаторы. Детерминистский подход

  1. Общие свойства линейных дискриминантных функций в детерминистской подстановке
  2. Персептронный алгоритм получения линейных решающих правил
  3. Правила поиска решения, основанные на минимизации градиента функции качества
    1. Формальный вывод персептронного алгоритма

4. Кластерный анализ

  1. Постановка задачи группировки данных
  2. Пример
  3. Критерии качества разбиения на классы
  4. Основные типы кластерных процедур. Основные задачи кластерного анализа
    1. Построение последовательной процедуры итеративной оптимизации
    2. Базовая процедура кластеризации (базовая минимальная квадратичная ошибка)
    3. Параллельная процедура. Базовые изоданные
      1. Описание процедуры: Базовые изоданные
      2. Алгоритм k-внутригрупповых средних
    4. Иерархические процедуры группировки
      1. Агломеративная процедура
  5. Статистические модели группировки
  6. Алгоритм автоматической классификации на основе использования кластер-анализа

5. Методы снижения размерности

  1. Методы отбора признаков по заданному критерию
  2. Метод главных компонент

6. Факторный анализ

  1. Модель факторного анализа
  2. Структура факторных уравнений
  3. Неоднозначность факторного решения
  4. Метод главных факторов
  5. Метод центроидных факторов

7. Многомерное шкалирование

  1. Дистанционная модель для различий
  2. Модель Торгерсона
    1. Поворот
    2. Объективные повороты
    3. Ручные повороты
    4. Размерность
    5. Интерпретация