0 / 0 / 0
Регистрация: 18.02.2019
Сообщений: 1
|
|
1 | |
по архитектуре18.02.2019, 14:50. Показов 362. Ответов 0
Метки нет (Все метки)
Здравствуйте,
У меня есть данные, которые собирает скрипт с разных сайтов. Данные представляют из себя папки в каждой из которых лежит файл, несколько фото, текстовый файл и несколько файлов с различными ссылками. Для того, чтобы не было повторов и двойных скачиваний у меня есть тестовый файл со списком уже посещенных ссылок на эти данные. Каждый раз при запуске скрипта из этого файле берутся все ссылки и сверяются с рабочей ссылкой. Если таковая уже есть, то скрипт останавливается. Долго такая жизнь продолжаться не может. Файл с посещенными ссылками растет и, рано или поздно, будет невозможно большим. Я хочу построить базу данных, чтобы обращаться не к файлу, а к таблице. Есть вопрос по архитектуре. Для ускорения индексинга, надо ли мне все свойства данных из папок иметь в одной большой таблице или правильно будет иметь отдельную таблицу со списком посещенных ссылок и связанные с этим другие таблицы с другими свойствами данных? Еще вопрос. Текстовую информацию правильнее держать в самой базе или в виде ссылки на файл? Заранее спасибо за ответ.
0
|
18.02.2019, 14:50 | |
Ответы с готовыми решениями:
0
Запутался в архитектуре БД Подскажите по архитектуре базы Литература по архитектуре Помощь в архитектуре |
18.02.2019, 14:50 | |
18.02.2019, 14:50 | |
Помогаю со студенческими работами здесь
1
Помощь в архитектуре Литература по архитектуре серверов Литература по архитектуре игр Посоветуйте по архитектуре приложения? Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |