Форум программистов, компьютерный форум, киберфорум
Python: Решение задач
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.50/6: Рейтинг темы: голосов - 6, средняя оценка - 4.50
0 / 0 / 0
Регистрация: 12.05.2022
Сообщений: 7

Обработка файла в Excel

22.06.2022, 12:14. Показов 1600. Ответов 9
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Добрый день, есть файл в Excel, полученный из конвертации документа-инвойса в формате PDF, в результате нужна с определенным количеством столбцов, но после конвертации есть лишние строки, которые могут быть: 1)пустые, 2)частично заполненные - не представляющие интереса, 3) заполненные частично, представляющие интерес и которые надо переместить в новую таблицу Excel. Задача первого порядка: произвести анализ строк, удалить пустые и повторяющиеся незначащие строки. Сейчас указанная работа проводится вручную. Задача второго порядка: сделать полноценную таблицу в которой заполнены все поля и текстовые и цифровые, которые были в исходном файле после конвертации.
0
Лучшие ответы (1)
IT_Exp
Эксперт
34794 / 4073 / 2104
Регистрация: 17.06.2006
Сообщений: 32,602
Блог
22.06.2022, 12:14
Ответы с готовыми решениями:

Обработка Excel файла
Доброго времени суток. Столкнулся с проблемой. Необходимо обработать файл Excel и выявить однотипные данные. В общем - приходит распечатка...

Обработка файла в Excel
Добрый день, есть файл в Excel, полученный из конвертации документа-инвойса в формате PDF, в результате получается таблица с определенным...

Быстрая обработка файла Excel
Ребятки, форумчане! тема думаю избитая, но все же подскажите пожалуйста, возможны ли какие то варианты, открытия xl файла которые работают...

9
Эксперт Python
8851 / 4502 / 1864
Регистрация: 27.03.2020
Сообщений: 7,317
22.06.2022, 12:38
kww53, pandas, если все данные в файле - значения; openpyxl или xlrd, если нужна работа с формулами или форматами в ячейках excel...
1
0 / 0 / 0
Регистрация: 12.05.2022
Сообщений: 7
23.06.2022, 16:49  [ТС]
Добрый день, а есть какие-то примеры на подобную тематику с использованием openpyxl или xlrd, или pandas? обрабатывать как я понимаю нужно будет строки и их анализировать на предмет поиска нужных значений в строке и перенос этих найденных значений в новую таблицу в соответствующие поля строк.
0
Эксперт Python
8851 / 4502 / 1864
Регистрация: 27.03.2020
Сообщений: 7,317
23.06.2022, 17:03
kww53, Если не сталкивался с pandas, тяжеловато будет (впрочем и с openpyxel и xlrd)
Посмотри:
Вложения
Тип файла: pdf ama2015_pandas.pdf (955.9 Кб, 11 просмотров)
0
0 / 0 / 0
Регистрация: 12.05.2022
Сообщений: 7
24.06.2022, 14:34  [ТС]
Да pandas тяжеловат для начала, по сути в моей задаче происходит, открытие файла, Анализ строки на то что она не пустая , анализ строки что в ней есть нужная информация, удаление пустых строк, и запись полученного в формате таблицы в новом файле.
0
Эксперт Python
8851 / 4502 / 1864
Регистрация: 27.03.2020
Сообщений: 7,317
24.06.2022, 17:18
kww53, файл выложи
Ну и опиши "нужная информация"
0
0 / 0 / 0
Регистрация: 12.05.2022
Сообщений: 7
24.06.2022, 17:54  [ТС]
Вот такой файликКнига2.xlsx, "ненужная информация" до строки 22, далее тело таблицы, после 52 тоже "ненужная информация"
0
Эксперт Python
8851 / 4502 / 1864
Регистрация: 27.03.2020
Сообщений: 7,317
24.06.2022, 20:53
Лучший ответ Сообщение было отмечено kww53 как решение

Решение

kww53,
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
import pandas as pd
import numpy as np
 
df = pd.read_excel('Книга2.xlsx', nrows=29, header=21, index_col=0)
 
df.iloc[:,1:2] = df.iloc[:,1:2].astype('str')
df.index = pd.Series(df.index).ffill().values.astype('int')
df = df.groupby(df.index).agg({'Number': 'first', 
                               'Description': ' '.join, 
                               'Quantity': 'last', 
                               'Price Total CHF': 'last', 
                               'Unnamed: 5': 'last'})
 
with pd.ExcelWriter('Книга2.xlsx', mode='a') as writer:  
    df.to_excel(writer, sheet_name='new_list')
print(df)
1
0 / 0 / 0
Регистрация: 12.05.2022
Сообщений: 7
27.06.2022, 17:35  [ТС]
Добрый день, Gdez, спасибо работает, как было в постановке задачи, о себе - Python только осваиваю, и ваша помощь с Pandas, это в точку, установил Pandas, протестировал, работает, вопрос только один - не понятна строка в new_list - строка 3
3 nan - в исходном файле там вроде пустая строка, в поле Number пусто вроде, хочу проверить на большом файле, там могут быть нюансы. Уж извините, если не разберусь, обращусь за помощью. Еще раз спасибо
0
Эксперт Python
8851 / 4502 / 1864
Регистрация: 27.03.2020
Сообщений: 7,317
27.06.2022, 19:04
kww53, pandas по умолчанию пустые значения в ячейках при чтении "считывает" их как NaN.
При желании их можно заменить на ноль или пустую строку:
Python
1
df.fillna('')
P.s. Конечно обращайся. Будет возможность, помогу

Добавлено через 1 минуту
Разберись со всеми методами при чтении из файла - большой файл может структурно отличаться от текущего
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
BasicMan
Эксперт
29316 / 5623 / 2384
Регистрация: 17.02.2009
Сообщений: 30,364
Блог
27.06.2022, 19:04
Помогаю со студенческими работами здесь

обработка большого файла excel
здравствуйте мне нужно парсить excel файл. в нём около 160 000 строк. делаю с помощью PHPExcel на локальном хостинге работает...

Обработка большого файла EXCEL
Есть база фото автозапчастей на хостинге (45000000), необходимо разработать макрос или программу, для привязки фото к прайсу по прямым...

Внешняя обработка excel файла
Всем здравствуйте, опыта в 1с почти нет, но нежданно негаданно появилась сильная нужда в этой обработке. И вот пришло время тестировать в...

Обработка excel файла из 50к строчек
Доброго времени суток, уважаемые форумчане. Мой вопрос скорее всего больше относится к советам. Ситуация такая - есть excel файл, в...

Обработка файла excel для mysql
Здравствуйте дорогие формунчани!Вот у меня проблемка есть не большая - прошу помощи Вашей!Я сделал не большую веб разработку ,которая...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
10
Ответ Создать тему
Новые блоги и статьи
SDL3 для Desktop (MinGW): Рисуем цветные прямоугольники с помощью рисовальщика SDL3 на Си и C++
8Observer8 17.03.2026
Содержание блога Финальные проекты на Си и на C++: finish-rectangles-sdl3-c. zip finish-rectangles-sdl3-cpp. zip
Символические и жёсткие ссылки в Linux.
algri14 15.03.2026
Существует два типа ссылок — символические и жёсткие. Ссылка в Linux — это запись в каталоге, которая может указывать либо на inode «файла-ИСТОЧНИКА», тогда это будет «жёсткая ссылка» (hard link),. . .
[Owen Logic] Поддержание уровня воды в резервуаре количеством включённых насосов: моделирование и выбор регулятора
ФедосеевПавел 14.03.2026
Поддержание уровня воды в резервуаре количеством включённых насосов: моделирование и выбор регулятора ВВЕДЕНИЕ Выполняя задание на управление насосной группой заполнения резервуара,. . .
делаю науч статью по влиянию грибов на сукцессию
anaschu 13.03.2026
прикрепляю статью
SDL3 для Desktop (MinGW): Создаём пустое окно с нуля для 2D-графики на SDL3, Си и C++
8Observer8 10.03.2026
Содержание блога Финальные проекты на Си и на C++: hello-sdl3-c. zip hello-sdl3-cpp. zip Результат:
Установка CMake и MinGW 13.1 для сборки С и C++ приложений из консоли и из Qt Creator в EXE
8Observer8 10.03.2026
Содержание блога MinGW - это коллекция инструментов для сборки приложений в EXE. CMake - это система сборки приложений. Здесь описаны базовые шаги для старта программирования с помощью CMake и. . .
Как дизайн сайта влияет на конверсию: 7 решений, которые реально повышают заявки
Neotwalker 08.03.2026
Многие до сих пор воспринимают дизайн сайта как “красивую оболочку”. На практике всё иначе: дизайн напрямую влияет на то, оставит человек заявку или уйдёт через несколько секунд. Даже если у вас. . .
Модульная разработка через nuget packages
DevAlt 07.03.2026
Сложившийся в . Net-среде способ разработки чаще всего предполагает монорепозиторий в котором находятся все исходники. При создании нового решения, мы просто добавляем нужные проекты и имеем. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru