Sidebar






Old

staff:courses:no_sql_introduction:course_work:topics

Темы для ИДЗ

Из чего складывается сложность:

  1. Доступность датасета
  2. Необходимость использовать несколько датасетов
  3. Необходимость использовать СУБД не совсем по назначению
  4. Алгоритмы

Темы в порядке возрастания субъективной сложности. Поле “Комментарий” содержит отправную точку для формулировки окончательного задания.

Название Предлагаемая СУБД Набор данных/API Комментарий
01 ИС Справочник медицинских организаций MongoDB https://www.roszdravnadzor.gov.ru/opendata/7710537160-lso Тема аналогична “(Сложно) ИС Справочник образовательных организаций Санкт-Петербурга”
02 ИС Компании по переработке вторсырья MongoDB Синтетический Необходимо сделать информационную систему для компании, которая занимается сбором вторсырья (макулатура, стекло, металл, пластик). У компании множество офисов, где принимают сырье у населения, служба выезда за вторсырьем, а также общий склад, где хранится все собранное у населения. Для сдающих вторсырье есть программа лояльности (аккаунты), в которых учитывается их статистика и пропорционально ей повышается тариф на скупку вторсырья. В модели данных нужно отразить сценарий как с точки зрения сдающего вторсырье, так и с точки зрения сотрудников (работник пункта приема, водитель, директор).
03 База данных статистики github репозиториев MongoDB Данные от https://github.com/OSLL/github_repo_commitment_calc Необходимо сделать базу данных для хранения результатов работы https://github.com/OSLL/github_repo_commitment_calc и фронтенд для нее, который позволяет находить аномалии, подсчитывать аггрегированную статистику
04 Каталог жилого фонда СПБ MongoDB https://classif.gov.spb.ru/irsi/7840013199-Tehniko-ekonomicheskie-pasporta-mnogokvartirnyh-domov/structure_version/207/ Необходимо сделать каталог жилищного фонда СПБ с привязкой к карте, хранением данных из набора данных. Фичи: поиск по значениям полей, агрегирование (например, ответить на вопрос - как по годам постройки распределены все дома с дровяными колонками), геопоиск (рисуем область на карте)
05 Каталог данных Роспатента MongoDB https://rospatent.gov.ru/opendata/7730176088-evm Необходимо сделать каталог свидетесльств с хранением данных из набора данных. Фичи: поиск по значениям полей, агрегирование по всем полям, полнотекстовый поиск
06 Фитнес сервис MongoDB Синтетические данные
07 Система автоматической проверки задач по математике MongoDB Синтетические Необходимо сделать простую систему проверки генерируемых случайно математических примеров (какие будут получатся примеры неважно). Для этой системы нужно разработать модель данных, которая позволит хранить: задачи, пользователей, попытки решения, сами решения, историю редактирования и историю действий…, а также проводить поиск и аналитику по данным - кто в худшем квартиле по успеваемости, у кого проблемы с какими действиями, кто отвлекается и тд
08 Информационная система аренды электросамокатов Neo4j https://data.world/datasets/scooter Разработать сервис, который позволит админстрировать компанию по аренде электросамокатов. Сущности - площадки выгрузки самокатов, склады, самокаты, технические данные самокатов, поездки, клиенты, администраторы, забирающие самокаты на подзарядку сотрудники. Эти данные необходимо смоделировать и в системе помимо поиска предоставить возможности аггрегации как по полям, так и по координатам (например, в каких областях города самокаты больше всего катались, самые загруженные / наименее загруженные улицы)
09 Сервис учета семейных финансов ArangoDB Ситнетические данные Идея - сделать веб-сервис для учета финансов (траты и поступления), где счета были бы общими для группы пользователей. Интересно получать поиска по транзакциям, источникам / главным расходам, аналитике по категориям / пользователям
10 ИС для управления учебным процессом в школе Neo4j Ситнетические данные Идея - сделать веб-сервис управления учебным процессом в школе. Что нужно учесть в модели данных: расписание, учителя, ученики, родители, разные классы, электронный дневник (домашние задания, отметки), контрольные, интерфейсы для обратной связи родителей.
11 ИС для свопа Mongo Ситнетические данные Необходимо сделать сервис для того, чтобы дистанционно организовывать своп https://www.ozon.ru/club/article/vesch-za-vesch-chto-takoe-svopy-i-deystvitelno-li-na-nih-mozhno-nayti-horoshuyu-odezhdu-98031/ .
12 ИС Почты MongoDb Синтетические данные Создаем свое приложение для работы почты. Моделируем отправку писем, бандеролей, посылок и прочего.
13 Сервис портфолио для программистов MongoDB Ситнетические данные + Github Необходимо сделать сервис, позволяющий программистам размещать информацию о своих достижениях, проектах, иных успехах (статистика репозиториев и тд) и валидировать навыки друг другу, а работодателям - искать интересные кандидатуры.
14 Каталог произведений искусства Memcached https://www.wga.hu/index1.html Сервис, позволяющий каталогиризовать (CRUD) произведения искусства и описывать их (а также выполнять поиск и подсчет статистики) по всем возможным полям
15 Система экологического мониторинга Neo4j OSM Сервис, позволяющий каталогиризовать (CRUD) экологические инциденты (свалки, загрязнение воздуха, слив отходов) на карте, провести аналитику . Роли - администратор, пользователь.
16 ИС Кафе быстрого питания MongoDB Синтетические данные Цель - создать сервис для информационной поддержки работы кафе быстрого питания. Задачи: управление запасами, фискация оплат, прогнозирование спроса, меню, смены, график уборки
17 ИС Курьерской фирмы Neo4j Синтетические данные Цель - создать сервис для работы курьерской службы, которая берет заказы на доставку. Задачи: управление рейсами (CRUD), автопарк (состав, ресурс, график ТО, бензин… ), курьеры, водители, грузчики, смены, бухгалтерия (заказы на доставку, выплаты фирме, выплаты сотрудникам)
18 ИС песчанного карьера Neo4j Синтетические данные Учет добычи, работники, охрана, пропуска, смены
19 Инструмент сбора данных о научных публикаций MongoDB Google Scholar / elibrary / ORCID / Publons API Делаем веб-инструмент для импорта данных из источников по сложным запросам (фио / организации / года / издания …), для аггрегации и генерации отчетов, экспорта
20 Райдшеринг Neo4j Ситнетические данные + OSM Сервис для поиска попутчиков. Необходимые фичи: поиск попутчиков, поиск поездок, расчет длительности и стоимости, запись, профили, рейтинги, агрегация и статиситка поездок как индивидуально, так и в масштабе сервиса. https://www.dictionary.com/browse/ridesharing#:~:text=noun,a%20usually%20privately%20owned%20vehicle
21 ИС Зоопарка Memcached http://www.spbzoo.ru/ Организуйте сервис для работы небольшого зоопарка, сущности для моделирования: посетители, билетная касса, животные (кормление, уборка, лечение),вольеры,сотрудники.
22 Приложение для мониторинга пациентов Memcached Синтетические данные Роли - пациенты, доктора; Доктора дают пациентам опросники, документы на подпись, аггрегируют данные по пациентам, планируют лечение и ведут карточки пациентов. Пациенты проходят опросы в приложении, выполняют тесты самостоятельно (например, на физ форму) и фиксируют результаты (фото видео), прикрепляют сканы заполненных документов, получают рекомендации.
23 Анализатор PUBMED Neo4j https://pubmed.ncbi.nlm.nih.gov/ Цель - создать сервис для аггрегирования тенденций / информации о публикуемых статьях по определенным запросам из PubMed. Задачи: импорт и парсинг данных, расстановка связей по темам, ключевым слоам,авторам, журналам, времени публикации; представление и поиск; поиск изолированных компонент; определение взаимосвязей между тематиками, авторами и тд
24 Построение маршрутов по рекам и каналам Neo4j OpenStreetMaps Задача - максимально смоделировать данные о реках / каналах СПБ, а также объектах инфраструктуры (причалы, пирсы, знаки для водного транспорта, мосты), обеспечить построение маршрутов и вычисление статистики
25 Юридические документы Neo4j Синтетические данные Смысл проекта - предоставить интерфейс для хранения, версионирования и анализа (грубого) юридических документов на русском языке. Варианты анализа: разбиение на предложения, абзацы, идентификация пунктов по ключевым словам, поиск формулировок-обязательств / требований ….
26 Поиск бутылочного горлышка в дорожной сети MongoDB OpenStreetMap data и/или Яндекс пробки Веб-инструмент, позволяющий визуализировать дорожную сеть на карте с расцветкой по уровню пробок, а также выполняющий анализ для заданных фрагментов сети на предмет наличия узкий мест транспортного потока.
27 ИС Справочник Музеев Memcached https://opendata.mkrf.ru/opendata/7705851331-museums Тема аналогична “(Сложно) ИС Справочник образовательных организаций Санкт-Петербурга”
28 ИС Справочник образовательных организаций Санкт-Петербурга Memcached https://petersburgedu.ru/institution/ Цель - создать каталог, хранящий максимум информации обо всех организациях. Задачи - хранение всех доступных полей, организация поиска, аггрегации, изменения данных каталога. Модель данных нужно построить так, чтобы на клиенте требовалась минимальная обработка (скоррее всего, вам предстоит сделать очень много дублирования данных)
29 Многоплатформенный CRM для ответов на обращения граждан ArangoDB VK / TG API У современных организаций есть проблема - очень много источников, где клиенты могут задать им вопрос (ВК и другие социальные сети, телеграм). Предлагается сделать информационную систему, которая будет выступать как CRM для двух источников заявок - VK паблик и Telegram чат. Необхдимо смоделировать такие данные: агенты поддержки, пользователи (учитывать разную информацию из разных источниках), сообщения (обращения пользователей), цепочки ответа по каждой проблеме. К данным нужен поиск, аггрегация и аналитика
30 Построение маршрутов с учетом плохой парковки Neo4j Открытые данные OpenStreetMap Необходимо взять в качестве демо данных квадрат карты, где находится Петроградский район и для него создать приложение, которое позволит строить маршруты из точки А в точку Б так, чтобы 1) при подъезде к точке Б нужно вести водителя не наикратчайшим путем, а кругами вдоль перспективных для парковки мест 2) при всем этом поездка по маршруту не была супердолгой
31 ИС анализа конкурсных объявлений / грантов MongoDB http://knvsh.gov.spb.ru/contests/ Идея - ежедневно появляется большое количество новых конкурсов / грантов для сотрудников и студентов ВУЗа, однако организация подачи и даже первичный анализ документов очень непрост из-за большого объема информации и сложному стилю изложения. Необходимо сделать ИС, которая в качестве входных данных принимает ссылки на конкурсы КНВШ, а на выходе (путем применения NLP) выдает струткурированную информацию по конкурсам. Смысл работы - структурировать информацию о конкурсе так, чтобы оператор системы смог глядя на нее быстро понять - стоит ли принимать участие в конкурсе и если да, то кого / что подать. Что стоит включить в модель (что нужно извлечь из текста) - приз, какая нужна отчетность, срок подачи документов, сроки конкурса, формат подачи документов (онлайн / очно), чьи подписи требуются на документах и на каких (только участника / ректора / руководителя ….)

Своя тема

  1. Интересный, содержательный и нужный пользователям сценарий использования
  2. Должен быть понятный, достаточный и доступный источник данных - публичный датасет, публичное api доступа к хранилищу данных
  3. Должно присутствовать решение задач хранения/анализа/представления/агрегации/импорта и экспорта данных
  4. Дополнительный плюс, если есть связь с существующим проектом и/или бакалаврской работой
  5. Информация об аналогах

Источники данных

staff/courses/no_sql_introduction/course_work/topics.txt · Last modified: 2022/12/10 09:08 (external edit)