С Новым годом! Форум программистов, компьютерный форум, киберфорум
Базы данных
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.71/34: Рейтинг темы: голосов - 34, средняя оценка - 4.71
0 / 0 / 0
Регистрация: 13.08.2013
Сообщений: 24

Правильная организация хранения исторических данных для существующей БД

11.11.2014, 12:44. Показов 7281. Ответов 13
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Приветствую всех!
Передо мной стоит задача организовать сохранение исторических данных для существующей БД. Организация занимается арендой недвижимости.
Есть обычная БД(3НФ) которая содержит список текущих предожений.
Вся информация об объектах аренды содержится в основной таблице [Предложения], в ней есть поле Дом(FK), информация о его номере, местоположении разнесена на таблицы [Дома], [Улицы], [Районы]. Таким образом информация об адресе предложения получается запросом с JOINами из этих таблиц.

Каким-то образом нужно сохранять историю, чтобы в клиенте оператор мог вывести на графики информацию следующего рода:
Как изменялась средняя стоимость аренды 2х-комнатной квартиры на улице X.
Как изменялось количество предложений по аренде квартир в доме X.
Как изменялось общее количество предложений по аренде квартир площадью больше X.


Комбинация может быть любая, и запрос должен иметь приемлемый таймаут.
Наверняка есть какие-то паттерны реализации подобного функционала.
Как я понял из теории, получается что сейчас есть только БД, а нужно смотреть в сторону понятий OLAP Data Warehouse или Data Mart. Или это это можно реализовать в рамках классической реляционной БД? Какие есть варианты? Спасибо!
0
Лучшие ответы (1)
IT_Exp
Эксперт
34794 / 4073 / 2104
Регистрация: 17.06.2006
Сообщений: 32,602
Блог
11.11.2014, 12:44
Ответы с готовыми решениями:

Организация структуры для хранения данных
Всем Привет! Может быть ошибся веткой... Есть БД в которой разные поля по типу, int, String, bool и т.д. Нужно организовать...

Организация хранения данных для электронной трудовой книжки
Здравствуйте! Задали создать приложение электронной трудовой книжки. Посмотрел в интернете, как выглядят данные (ФИО, Дата рождения, Дата...

Правильная организация базы данных
Добрый вечер уважаемый форум. Изучаю php путем создания своей небольшой игры. Сейчас добрался до момента который не могу разобрать. У...

13
Нет ТЗ - давай досвидания
 Аватар для BuPy7
746 / 377 / 64
Регистрация: 01.12.2011
Сообщений: 2,250
Записей в блоге: 6
11.11.2014, 13:11
Цитата Сообщение от ValeOFY Посмотреть сообщение
Как я понял из теории, получается что сейчас есть только БД, а нужно смотреть в сторону понятий OLAP Data Warehouse или Data Mart. Или это это можно реализовать в рамках классической реляционной БД? Какие есть варианты? Спасибо!
Чот загнули вы. Всё это решается одним, максимум 2мя запросами к БД. А там уже как вы отображать будете полученную информацию - другой вопрос. Обычно для этого используют графики. Готовых расширений на JS по этой теме много. Проблема тривиальная. Что вам нужно конкретно - мне не ясно.
0
0 / 0 / 0
Регистрация: 13.08.2013
Сообщений: 24
11.11.2014, 13:24  [ТС]
Дело в том, что в своем нынешнем виде таблица [Предложения] содержит только объекты, которые сдаются в данный момент. Если объект снимается - информация удаляется из таблицы и нигде не сохраняется. Соответственно нет исторических данных для вывода на графики.
0
Нет ТЗ - давай досвидания
 Аватар для BuPy7
746 / 377 / 64
Регистрация: 01.12.2011
Сообщений: 2,250
Записей в блоге: 6
11.11.2014, 14:29
ValeOFY, здесь уже проблема в том, что БД была спроектирована неверно. Незачем делать костыли, лучше сделать сразу как надо. Если данные нужны для статистики, то добавьте поле trash с типом enum('0', '1') и не удаляйте запись, а имитируйте это установив значение trash равное '1'.
0
4217 / 3059 / 583
Регистрация: 21.01.2011
Сообщений: 13,203
11.11.2014, 15:00
Можно просто завести 2 колонки: дата начала и дата конца.
0
Нет ТЗ - давай досвидания
 Аватар для BuPy7
746 / 377 / 64
Регистрация: 01.12.2011
Сообщений: 2,250
Записей в блоге: 6
11.11.2014, 15:05
Цитата Сообщение от Grossmeister Посмотреть сообщение
Можно просто завести 2 колонки: дата начала и дата конца.
Оно тут вообще причём?
0
4217 / 3059 / 583
Регистрация: 21.01.2011
Сообщений: 13,203
11.11.2014, 15:14
Цитата Сообщение от BuPy7 Посмотреть сообщение
Оно тут вообще причём?
При том, что позволяет определить, действует предложение на текущий момент или нет. Плюс формировать отчеты за любые временные промежутки для анализа.
0
Нет ТЗ - давай досвидания
 Аватар для BuPy7
746 / 377 / 64
Регистрация: 01.12.2011
Сообщений: 2,250
Записей в блоге: 6
11.11.2014, 15:16
Цитата Сообщение от Grossmeister Посмотреть сообщение
При том, что позволяет определить, действует предложение на текущий момент или нет. Плюс формировать отчеты за любые временные промежутки для анализа.
У него в условиях вообще такого нет. Сейчас главная проблема, что записи удаляются, поэтому собрать какую-то полноценную статистику невозможно.
0
4217 / 3059 / 583
Регистрация: 21.01.2011
Сообщений: 13,203
11.11.2014, 15:28
Цитата Сообщение от BuPy7 Посмотреть сообщение
Сейчас главная проблема, что записи удаляются, поэтому собрать какую-то полноценную статистику невозможно.
Именно. А твое предложение позволяет отличить ныне действующие от уже неактуальных, но нет никаких сведений, когда предложение было актуально. А любой анализ без привязки ко времени бессмысленен. Поскольку обычно весьма существенно, что было год назад, а что - 5 лет.

2TC
Если по каким-то причинам изменить существующие таблицы невозможно, то можно создать исторические таблицы, аналогичные по структуре существующим, но с датами. Тогда при удалении строки из исходной таблицы она переписывается триггером в историческую.
1
Нет ТЗ - давай досвидания
 Аватар для BuPy7
746 / 377 / 64
Регистрация: 01.12.2011
Сообщений: 2,250
Записей в блоге: 6
11.11.2014, 15:30
Цитата Сообщение от Grossmeister Посмотреть сообщение
А любой анализ без привязки ко времени бессмысленен.
Да он им может быть и не нужен. Им важен факт за всё время работы. Автор ведь не упомянул ничего о датах.

И да, можно триггерами. Никто не спорит.
0
0 / 0 / 0
Регистрация: 13.08.2013
Сообщений: 24
11.11.2014, 15:45  [ТС]
Цитата Сообщение от Grossmeister Посмотреть сообщение
При том, что позволяет определить, действует предложение на текущий момент или нет. Плюс формировать отчеты за любые временные промежутки для анализа.
Интересное решение, буду рассматривать. Но боюсь настанет момент, когда количество записей в таблице станет невероятно большим и таймаут запроса к ней (+JOINы других таблиц с адресом) станет неприемлемым. Т.е. я же не могу бесконечно в одну таблицу данные закидывать, надо их как-то обрабатывать, обобщать и делать какую-то выборку по времени что-ли.

Цитата Сообщение от BuPy7 Посмотреть сообщение
Да он им может быть и не нужен. Им важен факт за всё время работы. Автор ведь не упомянул ничего о датах.
Мы друг друга не поняли. Я имел ввиду что на графики надо выводить динамику изменения количества предложений/рыночную стоимость объектов с течением времени. + можно конкретизировать параметры интересующих объектов(например по району или количеству комнат).
0
4217 / 3059 / 583
Регистрация: 21.01.2011
Сообщений: 13,203
11.11.2014, 15:59
Лучший ответ Сообщение было отмечено ValeOFY как решение

Решение

Цитата Сообщение от ValeOFY Посмотреть сообщение
Т.е. я же не могу бесконечно в одну таблицу данные закидывать, надо их как-то обрабатывать, обобщать и делать какую-то выборку по времени что-ли.
Обязательно надо будет сделать индекс по датам (хотя бы по дате начала).
А далее возможны варианты.
Некоторые СУБД (например, Oracle) позволяют производить секционирование (partitioning) таблиц. Когда одну таблицу можно разбить, например, по временным интервалам и сама СУБД будет смотреть только те секции, которые относятся в данному запросу.
Если такое применяемая СУБД не позволяет, то можно самим создавать таблицы с данными, допустим, за год. Только тогда надо при написании запроса самому учитывать, к каким таблицам обращаться.
Либо, если, допустим, мы часто обращаемся к данным за последний год, а к остальным редко, то редко запрашиваемые данные можно переносить в архивную таблицу.

PS
В учетных системах вообще не принято удалять данные (м.б. за исключением неверно введенных). И отметка актуальности делается как раз за счет колонок с датами.
1
0 / 0 / 0
Регистрация: 13.08.2013
Сообщений: 24
11.11.2014, 21:24  [ТС]
Grossmeister, благодарю за развернуты ответ!

Добавлено через 4 часа 44 минуты
Grossmeister, Хочу уточнить пару моментов.

Объемы информации большие.
В базе в данный момент времени находится 300К объявлений.
Ежедневно она обновляется, возьмем 5% = 15К объявлений добавляется, столько же удаляется.
Таким образом за год будет ~ 5.5КК записей в таблице [Предложения].
Таблица [Дома] содержит 140К записей.

Скажем, я хочу получить график динамики стоимости аренды 2х-комнатных квартир за 3 года с шагом один месяц.
Получается, необходимо 36 запросов к этой БД, каждый из которых должен посчитать среднюю стоимость за месяц, и не просто всех квартир, а еще и удовлетворяющих некоторым условиям (2х-комнатные).

Неужели можно так просто все реализовать? Просто, ничего не удаляя.. Было бы замечательно!
Такой подход давал бы большую гибкость при анализе данных, ведь вся иформация останется в базе. Т.е. можно получить график изменения стоимости квартир, скажем, на 3-м этаже в панельных 5-тиэтажных домах площадью до 40 м.кв. на улице Ленина и.т.д.(конечно, это излишне специфический запрос, для примера).

Изначально я думал, что придется агрегировать информацию в какие-то другие исторические таблицы, которые бы содержали гораздо менее детальную информацию, и уже к ним делать запросы.

И второе. Знакомы ли вы с технологией SQL Azure Federations?
Если да, то подойдет ли эта технология для разделения этой огромной неочищаемой таблицы [Предложения], например по годам на разные федерации(как аналог partitioning)?
0
480 / 393 / 113
Регистрация: 24.04.2012
Сообщений: 1,632
Записей в блоге: 3
12.11.2014, 04:45
Цитата Сообщение от ValeOFY Посмотреть сообщение
Скажем, я хочу получить график динамики стоимости аренды 2х-комнатных квартир за 3 года с шагом один месяц.
Получается, необходимо 36 запросов к этой БД, каждый из которых должен посчитать среднюю стоимость за месяц, и не просто всех квартир, а еще и удовлетворяющих некоторым условиям (2х-комнатные).
Всего 1 запрос: условие по дате + по квартире, группировка по году + месяцу

Добавлено через 18 минут
Цитата Сообщение от Grossmeister Посмотреть сообщение
Можно просто завести 2 колонки: дата начала и дата конца.
Правильное предложение. Дата начала - дата предложения, Дата конца - дата снятия предложения. Я бы еще добавил поле "Причина снятия предложения". Логично было бы видеть почему снято предложение, например: арендована, предложение отменено арендодателем, изменение цены арендодателем, ... ну и еще какие-нибудь
1
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
BasicMan
Эксперт
29316 / 5623 / 2384
Регистрация: 17.02.2009
Сообщений: 30,364
Блог
12.11.2014, 04:45
Помогаю со студенческими работами здесь

Обьем исторических данных для генетического алгоритма
Здравствуйте! Возникла пара вопросов: 1. Как успешно настроить мат-модель с помощью генетического алгоритма, если исторических...

Организация хранения больших объемов данных
доброго времени суток. возникла задача обработки больших объемов данных: поступает поток бит, который разбивается на части определенной...

Организация хранения данных в программе тестирования знаний
Добрый день, форумчане. Возникла необходимость написать программу для тестирования знаний. И тут возник вопрос: где и как лучше...

Правильная организация потока для опроса внешних устройств
В программе необходимо организовать поток, который будет через определенное время опрашивать внешнее оборудование и, при необходимости,...

Организация хранения, добавления, удаления, редактирования задач для курсового проекта
Добавлено через 7 минут Вечер добрый. Нужна помощь по структурной реализации. Есть задание: сделайте обучающую программу 365 задач...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
14
Ответ Создать тему
Новые блоги и статьи
Модель микоризы: классовый агентный подход 3
anaschu 06.01.2026
aa0a7f55b50dd51c5ec569d2d10c54f6/ O1rJuneU_ls https:/ / vkvideo. ru/ video-115721503_456239114
Owen Logic: О недопустимости использования связки «аналоговый ПИД» + RegKZR
ФедосеевПавел 06.01.2026
Owen Logic: О недопустимости использования связки «аналоговый ПИД» + RegKZR ВВЕДЕНИЕ Введу сокращения: аналоговый ПИД — ПИД регулятор с управляющим выходом в виде числа в диапазоне от 0% до. . .
Модель микоризы: классовый агентный подход 2
anaschu 06.01.2026
репозиторий https:/ / github. com/ shumilovas/ fungi ветка по-частям. коммит Create переделка под биомассу. txt вход sc, но sm считается внутри мицелия. кстати, обьем тоже должен там считаться. . . .
Расчёт токов в цепи постоянного тока
igorrr37 05.01.2026
/ * Дана цепь постоянного тока с сопротивлениями и напряжениями. Надо найти токи в ветвях. Программа составляет систему уравнений по 1 и 2 законам Кирхгофа и решает её. Последовательность действий:. . .
Новый CodeBlocs. Версия 25.03
palva 04.01.2026
Оказывается, недавно вышла новая версия CodeBlocks за номером 25. 03. Когда-то давно я возился с только что вышедшей тогда версией 20. 03. С тех пор я давно снёс всё с компьютера и забыл. Теперь. . .
Модель микоризы: классовый агентный подход
anaschu 02.01.2026
Раньше это было два гриба и бактерия. Теперь три гриба, растение. И на уровне агентов добавится между грибами или бактериями взаимодействий. До того я пробовал подход через многомерные массивы,. . .
Советы по крайней бережливости. Внимание, это ОЧЕНЬ длинный пост.
Programma_Boinc 28.12.2025
Советы по крайней бережливости. Внимание, это ОЧЕНЬ длинный пост. Налог на собак: https:/ / **********/ gallery/ V06K53e Финансовый отчет в Excel: https:/ / **********/ gallery/ bKBkQFf Пост отсюда. . .
Кто-нибудь знает, где можно бесплатно получить настольный компьютер или ноутбук? США.
Programma_Boinc 26.12.2025
Нашел на реддите интересную статью под названием Anyone know where to get a free Desktop or Laptop? Ниже её машинный перевод. После долгих разбирательств я наконец-то вернула себе. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru