|
0 / 0 / 0
Регистрация: 12.05.2022
Сообщений: 7
|
|
Обработка файла в Excel22.06.2022, 12:14. Показов 1600. Ответов 9
Метки нет (Все метки)
Добрый день, есть файл в Excel, полученный из конвертации документа-инвойса в формате PDF, в результате нужна с определенным количеством столбцов, но после конвертации есть лишние строки, которые могут быть: 1)пустые, 2)частично заполненные - не представляющие интереса, 3) заполненные частично, представляющие интерес и которые надо переместить в новую таблицу Excel. Задача первого порядка: произвести анализ строк, удалить пустые и повторяющиеся незначащие строки. Сейчас указанная работа проводится вручную. Задача второго порядка: сделать полноценную таблицу в которой заполнены все поля и текстовые и цифровые, которые были в исходном файле после конвертации.
0
|
|
| 22.06.2022, 12:14 | |
|
Ответы с готовыми решениями:
9
Обработка Excel файла Обработка файла в Excel Быстрая обработка файла Excel |
|
8851 / 4502 / 1864
Регистрация: 27.03.2020
Сообщений: 7,317
|
|
| 22.06.2022, 12:38 | |
|
kww53,
pandas, если все данные в файле - значения; openpyxl или xlrd, если нужна работа с формулами или форматами в ячейках excel...
1
|
|
|
0 / 0 / 0
Регистрация: 12.05.2022
Сообщений: 7
|
|
| 23.06.2022, 16:49 [ТС] | |
|
Добрый день, а есть какие-то примеры на подобную тематику с использованием openpyxl или xlrd, или pandas? обрабатывать как я понимаю нужно будет строки и их анализировать на предмет поиска нужных значений в строке и перенос этих найденных значений в новую таблицу в соответствующие поля строк.
0
|
|
|
8851 / 4502 / 1864
Регистрация: 27.03.2020
Сообщений: 7,317
|
|
| 23.06.2022, 17:03 | |
|
kww53, Если не сталкивался с pandas, тяжеловато будет (впрочем и с openpyxel и xlrd)
Посмотри:
0
|
|
|
0 / 0 / 0
Регистрация: 12.05.2022
Сообщений: 7
|
|
| 24.06.2022, 14:34 [ТС] | |
|
Да pandas тяжеловат для начала, по сути в моей задаче происходит, открытие файла, Анализ строки на то что она не пустая , анализ строки что в ней есть нужная информация, удаление пустых строк, и запись полученного в формате таблицы в новом файле.
0
|
|
|
8851 / 4502 / 1864
Регистрация: 27.03.2020
Сообщений: 7,317
|
|
| 24.06.2022, 17:18 | |
|
kww53, файл выложи
Ну и опиши "нужная информация"
0
|
|
|
0 / 0 / 0
Регистрация: 12.05.2022
Сообщений: 7
|
|
| 24.06.2022, 17:54 [ТС] | |
|
Вот такой файликКнига2.xlsx, "ненужная информация" до строки 22, далее тело таблицы, после 52 тоже "ненужная информация"
0
|
|
|
8851 / 4502 / 1864
Регистрация: 27.03.2020
Сообщений: 7,317
|
||||||
| 24.06.2022, 20:53 | ||||||
Сообщение было отмечено kww53 как решение
Решение
kww53,
1
|
||||||
|
0 / 0 / 0
Регистрация: 12.05.2022
Сообщений: 7
|
|
| 27.06.2022, 17:35 [ТС] | |
|
Добрый день, Gdez, спасибо работает, как было в постановке задачи, о себе - Python только осваиваю, и ваша помощь с Pandas, это в точку, установил Pandas, протестировал, работает, вопрос только один - не понятна строка в new_list - строка 3
3 nan - в исходном файле там вроде пустая строка, в поле Number пусто вроде, хочу проверить на большом файле, там могут быть нюансы. Уж извините, если не разберусь, обращусь за помощью. Еще раз спасибо
0
|
|
|
8851 / 4502 / 1864
Регистрация: 27.03.2020
Сообщений: 7,317
|
||||||
| 27.06.2022, 19:04 | ||||||
|
kww53, pandas по умолчанию пустые значения в ячейках при чтении "считывает" их как NaN.
При желании их можно заменить на ноль или пустую строку:
Добавлено через 1 минуту Разберись со всеми методами при чтении из файла - большой файл может структурно отличаться от текущего
0
|
||||||
| 27.06.2022, 19:04 | |
|
Помогаю со студенческими работами здесь
10
обработка большого файла excel Обработка большого файла EXCEL Внешняя обработка excel файла
Обработка файла excel для mysql Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
|||
|
SDL3 для Desktop (MinGW): Рисуем цветные прямоугольники с помощью рисовальщика SDL3 на Си и C++
8Observer8 17.03.2026
Содержание блога
Финальные проекты на Си и на C++:
finish-rectangles-sdl3-c. zip
finish-rectangles-sdl3-cpp. zip
|
Символические и жёсткие ссылки в Linux.
algri14 15.03.2026
Существует два типа ссылок — символические и жёсткие.
Ссылка в Linux — это запись в каталоге, которая может указывать либо на inode «файла-ИСТОЧНИКА», тогда это будет «жёсткая ссылка» (hard link),. . .
|
[Owen Logic] Поддержание уровня воды в резервуаре количеством включённых насосов: моделирование и выбор регулятора
ФедосеевПавел 14.03.2026
Поддержание уровня воды в резервуаре количеством включённых насосов: моделирование и выбор регулятора
ВВЕДЕНИЕ
Выполняя задание на управление насосной группой заполнения резервуара,. . .
|
делаю науч статью по влиянию грибов на сукцессию
anaschu 13.03.2026
прикрепляю статью
|
|
SDL3 для Desktop (MinGW): Создаём пустое окно с нуля для 2D-графики на SDL3, Си и C++
8Observer8 10.03.2026
Содержание блога
Финальные проекты на Си и на C++:
hello-sdl3-c. zip
hello-sdl3-cpp. zip
Результат:
|
Установка CMake и MinGW 13.1 для сборки С и C++ приложений из консоли и из Qt Creator в EXE
8Observer8 10.03.2026
Содержание блога
MinGW - это коллекция инструментов для сборки приложений в EXE. CMake - это система сборки приложений. Здесь описаны базовые шаги для старта программирования с помощью CMake и. . .
|
Как дизайн сайта влияет на конверсию: 7 решений, которые реально повышают заявки
Neotwalker 08.03.2026
Многие до сих пор воспринимают дизайн сайта как “красивую оболочку”. На практике всё иначе: дизайн напрямую влияет на то, оставит человек заявку или уйдёт через несколько секунд.
Даже если у вас. . .
|
Модульная разработка через nuget packages
DevAlt 07.03.2026
Сложившийся в . Net-среде способ разработки чаще всего предполагает
монорепозиторий в котором находятся все исходники.
При создании нового решения, мы просто добавляем нужные проекты
и имеем. . .
|