10 / 12 / 0
Регистрация: 20.07.2011
Сообщений: 430
|
|
1 | |
Объединение БД18.01.2021, 16:26. Показов 2737. Ответов 27
Метки нет (Все метки)
Я чайник.
У меня есть 4 БД. В каждой или 43 или 51 поле и записей в каждой более 10 млн. Есть 4 задачи которые я должна решить. 1/5 данных нужно использовать для анализа, остальное для тестирования. Как удобнее и быстрее: 1) убрать лишнее из каждой базы по отдельности, а потом объединить или сначала объединить, а потом чистить? 2) Можно ли (нужно ли) выделить 1/5 каждой базы сразу, ещё до объединения? 3) Все 4 задачи решать сразу или по очереди? Т.е. данные сразу отбирать или смотреть их 4 раза в соответствии с задачами.
0
|
18.01.2021, 16:26 | |
Ответы с готовыми решениями:
27
Объединение двух таблиц (запрос на объединение) Объединение таблиц (внешнее объединение) Использование подзапроса, левое внешнее объединение, правое внешнее объединение Доказать, что всякое множество, есть: 1.объединение всех своих подмножеств 2.объединение всех своих конечных подмножеств |
928 / 690 / 269
Регистрация: 10.12.2016
Сообщений: 1,696
|
|
19.01.2021, 20:57 | 21 |
насколько я увидел, там есть примеры ноутбуков, только под pandas все заточено
https://www.kaggle.com/bmurphmedia/parking Добавлено через 4 минуты и по нему мануалы есть https://www.kaggle.com/learn/pandas
0
|
20.01.2021, 09:04 | 22 |
Неоднозначный вопрос. Возможно sqlite, потому что он в комплекте с питоном - если вам нужна действительно БД.
Если у вас голый массив чисел, которым вы потом будете ворочать через numpy - можно попробовать HDF. Если идти по пути sql - разумеется, одну БД. Одна БД может содержать много таблиц. Не уверен, что вы различаете БД и таблицу. В общем, основы работы с БД нужны, да.
0
|
10 / 12 / 0
Регистрация: 20.07.2011
Сообщений: 430
|
|
20.01.2021, 09:21 [ТС] | 23 |
В задании речь о парковочных талонах. Там в меньшей степени числа, больше текст. Что в БД входят таблицы я знаю.
dondublon, я написала Вам в личку.
0
|
10 / 12 / 0
Регистрация: 20.07.2011
Сообщений: 430
|
|
20.01.2021, 10:08 [ТС] | 25 |
Из поставленных мною трёх вопросов. Конкретный ответ (я бы сказала, неоднозначны при этом) получила только на один.
Видимо то, что я чайник, даёт возможность растекаться или наоборот не даёт мне понять ваши ответы. Пожалуйста, если можно ответить на мои вопросы, ответьте на них так чтобы я поняла. Как удобнее и быстрее: 1) убрать лишнее из каждой базы по отдельности, а потом объединить или сначала объединить, а потом чистить? 2) Можно ли (нужно ли) выделить 1/5 каждой базы сразу, ещё до объединения? Я понимаю, что у меня ещё не база данных, но из вашего опыта работы, как делать проще? быстрее?
0
|
20.01.2021, 10:14 | 26 |
Прежде, чем убирать из базы, у вас должна быть база. Вот этим вопросом и займитесь.
1. Создать базу. 2. Загрузить в неё ваши csv. Из опыта работы - решать задачи по порядку. У вас ещё нет такого вИдения, чтобы загадывать наперёд.
0
|
10 / 12 / 0
Регистрация: 20.07.2011
Сообщений: 430
|
|
20.01.2021, 10:52 [ТС] | 27 |
Так я и спрашиваю у тех у кого есть опыт, чтобы видеть.
Но Ваш посыл я поняла. Сначала база, а потом всё остальное. Спасибо.
0
|
10 / 12 / 0
Регистрация: 20.07.2011
Сообщений: 430
|
|
20.01.2021, 19:56 [ТС] | 28 |
Народ, спасибо.
Мне на пальцах объяснили как я не права. Никакой бд мне не нужно, а таблица у меня и так уже есть. Моя задача про нейронные сети и машинное обучение. К базам данных отношение не имеет.
0
|
20.01.2021, 19:56 | |
20.01.2021, 19:56 | |
Помогаю со студенческими работами здесь
28
объединение Объединение Объединение Объединение БД Объединение Объединение Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |