|
1 / 1 / 0
Регистрация: 07.05.2013
Сообщений: 34
|
|
Как разбить огромный csv файл30.12.2016, 14:33. Показов 19507. Ответов 51
Добрый день, помогите решить задачу: есть ексель файл на 5000 строк и есть огромный csv файл на 1,16 Гбайт, нужно найти совпадающие значения в этих файлах пробовал через функцию ВПР находится все до 1000000 строк, а больше ексель не показывает так как стоит ограничение в этом пределе, а сам csv файл предположительно на 50000000 строк я хочу его разбить на 50 меньших файлов и по отдельности произвести поиск совпадающих строк, как это можно сделать? Или подскажите пожалуйста другой способ найти совпадающие строки с моим маленьким файлом и этим огромнейшим csv файлом
0
|
|
| 30.12.2016, 14:33 | |
|
Ответы с готовыми решениями:
51
Как разбить файл на две части, разархивировать и изменить вторую часть, а потом собрать файл обратно? Разделить огромный txt файл на куски и поместить в различные книги excel Как сохранить в csv utf8 кодировки файл из exсel? |
|
3218 / 967 / 223
Регистрация: 29.05.2010
Сообщений: 2,087
|
|
| 12.01.2017, 14:55 | |
|
Можно сформировать базу данных недействительных паспортов и в Excel, занимать по объему ~ 600Мб. Сократить можно и еще если записи хранить в бинарном варианте.
0
|
|
|
914 / 562 / 88
Регистрация: 13.02.2014
Сообщений: 2,082
|
|
| 12.01.2017, 15:04 | |
|
Любым скриптовым языком.
0
|
|
|
6997 / 2895 / 555
Регистрация: 19.10.2012
Сообщений: 8,803
|
|
| 12.01.2017, 15:54 | |
|
Вообще по уму должен был бы быть онлайнсервис под это дело, чтоб оперативно проверялось. Ибо даже если каждую ночь качать свежих 1.5 гига паспортов - всё равно можно что-то пропустить.
0
|
|
|
3218 / 967 / 223
Регистрация: 29.05.2010
Сообщений: 2,087
|
|
| 12.01.2017, 16:41 | |
|
0
|
|
|
6997 / 2895 / 555
Регистрация: 19.10.2012
Сообщений: 8,803
|
|
| 12.01.2017, 17:51 | |
|
Я туда не заходил, подумал что там только файл
![]() Этот сервис не то, что я бы хотел видеть, это только по одному и ещё капча...
0
|
|
|
1 / 1 / 0
Регистрация: 07.05.2013
Сообщений: 34
|
|
| 13.01.2017, 00:02 [ТС] | |
|
Hugo121, toiai,
Ребят вы в каком екселе делали, у меня дома 2007 и вот результат этого макроса, как бы он работает, в екселе пишет что не отвечает она явно с большими данными работает, но выдает только такое, хотя скопировал с 1.csv строку которая там есть Могли бы вы скинуть на почту aroma4s@yandex.ru ваш рабочий файл, а то я даже не понимаю что не так
0
|
|
|
6997 / 2895 / 555
Регистрация: 19.10.2012
Сообщений: 8,803
|
||||||
| 13.01.2017, 09:27 | ||||||
Сообщение было отмечено aroma4s как решение
Решение
Ну нормально всё, работает
![]() Чтоб не подвисало и можно было бы параллельно читать форумы, и видеть процесс - замените всё на это:
0
|
||||||
|
6997 / 2895 / 555
Регистрация: 19.10.2012
Сообщений: 8,803
|
|
| 13.01.2017, 10:03 | |
|
Как не появляется? Вижу ведь новую шапку и у одного паспорта запись что он негодный.
Ну а если все годные - то только шапка и будет. Ну можно конечно всем годным записать что они годные - тогда вместо строки a(i, 1) = Empty напишите в коде a(i, 1) = "годный"
0
|
|
|
6997 / 2895 / 555
Регистрация: 19.10.2012
Сообщений: 8,803
|
|
| 13.01.2017, 12:49 | |
|
Вся теория давно описана Уокенбахом например.
Но вопрос про стандарт этих номеров так и остался открытым - т.ч. я за возможный брак в работе не отвечаю.
0
|
|
| 13.01.2017, 13:28 | |
|
0
|
|
| 13.01.2017, 13:28 | |
|
Помогаю со студенческими работами здесь
52
Как сохранить VBA-массив в CSV-файл без Excel Как разбить большой файл сохранив макросы во всех частях? Как разбить CSV файл на отдельные файлы Запись в CSV-файл из массива. Не является форматом csv! Огромный EXE Файл , Нужна помошь Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
||||
|
PhpStorm 2025.3: WSL Terminal всегда стартует в ~
and_y87 14.12.2025
PhpStorm 2025. 3: WSL Terminal всегда стартует в ~ (home), игнорируя директорию проекта
Симптом:
После обновления до PhpStorm 2025. 3 встроенный терминал WSL открывается в домашней директории. . .
|
Access
VikBal 11.12.2025
Помогите пожалуйста !! Как объединить 2 одинаковые БД Access с разными данными.
|
Новый ноутбук
volvo 07.12.2025
Всем привет.
По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне:
Ryzen 5 7533HS
64 Gb DDR5
1Tb NVMe
16" Full HD Display
Win11 Pro
|
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
|
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
|
|
Поиск "дружественных имён" СОМ портов
Argus19 22.11.2025
Поиск "дружественных имён" СОМ портов
На странице:
https:/ / norseev. ru/ 2018/ 01/ 04/ comportlist_windows/
нашёл схожую тему. Там приведён код на С++, который показывает только имена СОМ портов, типа,. . .
|
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Programma_Boinc 20.11.2025
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Вот решила сделать интересный приблизительный подсчет, сколько государство потратило на меня денег на покупку инсулинов.
. . .
|
Ломающие изменения в C#.NStar Alpha
Etyuhibosecyu 20.11.2025
Уже можно не только тестировать, но и пользоваться C#. NStar - писать оконные приложения, содержащие надписи, кнопки, текстовые поля и даже изображения, например, моя игра "Три в ряд" написана на этом. . .
|
Мысли в слух
kumehtar 18.11.2025
Кстати, совсем недавно имел разговор на тему медитаций с людьми. И обнаружил, что они вообще не понимают что такое медитация и зачем она нужна. Самые базовые вещи. Для них это - когда просто люди. . .
|
Создание Single Page Application на фреймах
krapotkin 16.11.2025
Статья исключительно для начинающих. Подходы оригинальностью не блещут.
В век Веб все очень привыкли к дизайну Single-Page-Application .
Быстренько разберем подход "на фреймах".
Мы делаем одну. . .
|