|
0 / 0 / 0
Регистрация: 13.08.2013
Сообщений: 24
|
|
Правильная организация хранения исторических данных для существующей БД11.11.2014, 12:44. Показов 7351. Ответов 13
Метки нет (Все метки)
Приветствую всех!
Передо мной стоит задача организовать сохранение исторических данных для существующей БД. Организация занимается арендой недвижимости. Есть обычная БД(3НФ) которая содержит список текущих предожений. Вся информация об объектах аренды содержится в основной таблице [Предложения], в ней есть поле Дом(FK), информация о его номере, местоположении разнесена на таблицы [Дома], [Улицы], [Районы]. Таким образом информация об адресе предложения получается запросом с JOINами из этих таблиц. Каким-то образом нужно сохранять историю, чтобы в клиенте оператор мог вывести на графики информацию следующего рода: Как изменялась средняя стоимость аренды 2х-комнатной квартиры на улице X. Как изменялось количество предложений по аренде квартир в доме X. Как изменялось общее количество предложений по аренде квартир площадью больше X. Комбинация может быть любая, и запрос должен иметь приемлемый таймаут. Наверняка есть какие-то паттерны реализации подобного функционала. Как я понял из теории, получается что сейчас есть только БД, а нужно смотреть в сторону понятий OLAP Data Warehouse или Data Mart. Или это это можно реализовать в рамках классической реляционной БД? Какие есть варианты? Спасибо!
0
|
|
| 11.11.2014, 12:44 | |
|
Ответы с готовыми решениями:
13
Организация структуры для хранения данных Организация хранения данных для электронной трудовой книжки Правильная организация базы данных |
|
Нет ТЗ - давай досвидания
|
||
| 11.11.2014, 13:11 | ||
|
0
|
||
|
0 / 0 / 0
Регистрация: 13.08.2013
Сообщений: 24
|
|
| 11.11.2014, 13:24 [ТС] | |
|
Дело в том, что в своем нынешнем виде таблица [Предложения] содержит только объекты, которые сдаются в данный момент. Если объект снимается - информация удаляется из таблицы и нигде не сохраняется. Соответственно нет исторических данных для вывода на графики.
0
|
|
|
Нет ТЗ - давай досвидания
|
|
| 11.11.2014, 14:29 | |
|
ValeOFY, здесь уже проблема в том, что БД была спроектирована неверно. Незачем делать костыли, лучше сделать сразу как надо. Если данные нужны для статистики, то добавьте поле trash с типом enum('0', '1') и не удаляйте запись, а имитируйте это установив значение trash равное '1'.
0
|
|
|
4217 / 3059 / 583
Регистрация: 21.01.2011
Сообщений: 13,203
|
|
| 11.11.2014, 15:00 | |
|
Можно просто завести 2 колонки: дата начала и дата конца.
0
|
|
|
4217 / 3059 / 583
Регистрация: 21.01.2011
Сообщений: 13,203
|
||
| 11.11.2014, 15:14 | ||
|
0
|
||
|
4217 / 3059 / 583
Регистрация: 21.01.2011
Сообщений: 13,203
|
||
| 11.11.2014, 15:28 | ||
|
2TC Если по каким-то причинам изменить существующие таблицы невозможно, то можно создать исторические таблицы, аналогичные по структуре существующим, но с датами. Тогда при удалении строки из исходной таблицы она переписывается триггером в историческую.
1
|
||
|
0 / 0 / 0
Регистрация: 13.08.2013
Сообщений: 24
|
|||
| 11.11.2014, 15:45 [ТС] | |||
|
0
|
|||
|
4217 / 3059 / 583
Регистрация: 21.01.2011
Сообщений: 13,203
|
||
| 11.11.2014, 15:59 | ||
Сообщение было отмечено ValeOFY как решение
РешениеА далее возможны варианты. Некоторые СУБД (например, Oracle) позволяют производить секционирование (partitioning) таблиц. Когда одну таблицу можно разбить, например, по временным интервалам и сама СУБД будет смотреть только те секции, которые относятся в данному запросу. Если такое применяемая СУБД не позволяет, то можно самим создавать таблицы с данными, допустим, за год. Только тогда надо при написании запроса самому учитывать, к каким таблицам обращаться. Либо, если, допустим, мы часто обращаемся к данным за последний год, а к остальным редко, то редко запрашиваемые данные можно переносить в архивную таблицу. PS В учетных системах вообще не принято удалять данные (м.б. за исключением неверно введенных). И отметка актуальности делается как раз за счет колонок с датами.
1
|
||
|
0 / 0 / 0
Регистрация: 13.08.2013
Сообщений: 24
|
|
| 11.11.2014, 21:24 [ТС] | |
|
Grossmeister, благодарю за развернуты ответ!
Добавлено через 4 часа 44 минуты Grossmeister, Хочу уточнить пару моментов. Объемы информации большие. В базе в данный момент времени находится 300К объявлений. Ежедневно она обновляется, возьмем 5% = 15К объявлений добавляется, столько же удаляется. Таким образом за год будет ~ 5.5КК записей в таблице [Предложения]. Таблица [Дома] содержит 140К записей. Скажем, я хочу получить график динамики стоимости аренды 2х-комнатных квартир за 3 года с шагом один месяц. Получается, необходимо 36 запросов к этой БД, каждый из которых должен посчитать среднюю стоимость за месяц, и не просто всех квартир, а еще и удовлетворяющих некоторым условиям (2х-комнатные). Неужели можно так просто все реализовать? Просто, ничего не удаляя.. Было бы замечательно! Такой подход давал бы большую гибкость при анализе данных, ведь вся иформация останется в базе. Т.е. можно получить график изменения стоимости квартир, скажем, на 3-м этаже в панельных 5-тиэтажных домах площадью до 40 м.кв. на улице Ленина и.т.д.(конечно, это излишне специфический запрос, для примера). Изначально я думал, что придется агрегировать информацию в какие-то другие исторические таблицы, которые бы содержали гораздо менее детальную информацию, и уже к ним делать запросы. И второе. Знакомы ли вы с технологией SQL Azure Federations? Если да, то подойдет ли эта технология для разделения этой огромной неочищаемой таблицы [Предложения], например по годам на разные федерации(как аналог partitioning)?
0
|
|
| 12.11.2014, 04:45 | |||
|
Добавлено через 18 минут
1
|
|||
| 12.11.2014, 04:45 | |
|
Помогаю со студенческими работами здесь
14
Обьем исторических данных для генетического алгоритма Организация хранения больших объемов данных Организация хранения данных в программе тестирования знаний Правильная организация потока для опроса внешних устройств Организация хранения, добавления, удаления, редактирования задач для курсового проекта Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
|||
|
SDL3 для Web (WebAssembly): Реализация движения на Box2D v3 - трение и коллизии с повёрнутыми стенами
8Observer8 20.02.2026
Содержание блога
Box2D позволяет легко создать главного героя, который не проходит сквозь стены и перемещается с заданным трением о препятствия, которые можно располагать под углом, как верхнее. . .
|
Конвертировать закладки radiotray-ng в m3u-плейлист
damix 19.02.2026
Это можно сделать скриптом для PowerShell. Использование
. \СonvertRadiotrayToM3U. ps1 <path_to_bookmarks. json>
Рядом с файлом bookmarks. json появится файл bookmarks. m3u с результатом.
# Check if. . .
|
Семь CDC на одном интерфейсе: 5 U[S]ARTов, 1 CAN и 1 SSI
Eddy_Em 18.02.2026
Постепенно допиливаю свою "многоинтерфейсную плату". Выглядит вот так:
https:/ / www. cyberforum. ru/ blog_attachment. php?attachmentid=11617&stc=1&d=1771445347
Основана на STM32F303RBT6.
На борту пять. . .
|
Камера Toupcam IUA500KMA
Eddy_Em 12.02.2026
Т. к. у всяких "хикроботов" слишком уж мелкий пиксель, для подсмотра в ESPriF они вообще плохо годятся: уже 14 величину можно рассмотреть еле-еле лишь на экспозициях под 3 секунды (а то и больше),. . .
|
|
И ясному Солнцу
zbw 12.02.2026
И ясному Солнцу,
и светлой Луне.
В мире
покоя нет
и люди
не могут жить в тишине.
А жить им немного лет.
|
«Знание-Сила»
zbw 12.02.2026
«Знание-Сила»
«Время-Деньги»
«Деньги -Пуля»
|
SDL3 для Web (WebAssembly): Подключение Box2D v3, физика и отрисовка коллайдеров
8Observer8 12.02.2026
Содержание блога
Box2D - это библиотека для 2D физики для анимаций и игр. С её помощью можно определять были ли коллизии между конкретными объектами и вызывать обработчики событий столкновения. . . .
|
SDL3 для Web (WebAssembly): Загрузка PNG с прозрачным фоном с помощью SDL_LoadPNG (без SDL3_image)
8Observer8 11.02.2026
Содержание блога
Библиотека SDL3 содержит встроенные инструменты для базовой работы с изображениями - без использования библиотеки SDL3_image. Пошагово создадим проект для загрузки изображения. . .
|