Форум программистов, компьютерный форум, киберфорум
Python для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
0 / 0 / 0
Регистрация: 10.09.2021
Сообщений: 15

Отфильтровать строки с чередованием

06.03.2024, 16:41. Показов 456. Ответов 5
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Имеется текстовый файл (пример записей)
0.42
0.33
0.45
0.0
0.22
0.55
0.73
1.0
и т.д.
одно double число в строке.
В примере первые три числа - данные нужные для последующей обработки, а 0.0 - признак типа данных. Потом опять три числа данные, а 1.0 - признак другого типа данных. Чисел данных всегда в данном случае три. А после этих трех чисел всегда идет ноль или один в качества признака этих данных. Эти наборы данных в файле расположены в хаотичном порядке. В файле могут располагаться группами или одиночно совершенно случайным образом.
Задача состоит в том, чтобы представить эти данные в виде 2д массива (списка) с чередующимися значениями типов данных. Данных с "0.0" заведомо больше и лишние нужно отбросить. Порядок в наборе данных важен, а порядок строк в массиве нет.
Пример:
0.42 0.33 0.45 0.0
0.22 0.55 0.73 1.0
-------------- 0.0
-------------- 1.0
и т.д.

Значит я пробовал так:
Python
1
2
3
4
5
6
7
8
9
10
11
12
import numpy as np
import pandas as pd
 
 
data = np.loadtxt('C:\\prover.txt')
row = int(len(data) / 2101)                   #у меня в строке не 4 числа, как в примере, а 2101 
d = np.reshape(data, (row, 2101))
df = pd.DataFrame(d)
print(df.loc)
z = df.loc[df['2100'] == 0.0]                #тут я хотел сделать два списка- для 0 и для 1. Но при сортировке 0 уже не работает
print(z)
o = df.loc[df['2100'] == 1.0]
Затем я хотел в цикле объединить два списка.

Код ошибки:
Traceback (most recent call last):
File "C:\Users\Pc\AppData\Local\Programs\Pyth on\Python39\lib\code.py", line 90, in runcode
exec(code, self.locals)
File "<input>", line 1, in <module>
File "C:\Program Files\JetBrains\PyCharm 2022.2\plugins\python\helpers\pydev\_pyd ev_bundle\pydev_umd.py", line 198, in runfile
pydev_imports.execfile(filename, global_vars, local_vars) # execute the script
File "C:\Program Files\JetBrains\PyCharm 2022.2\plugins\python\helpers\pydev\_pyd ev_imps\_pydev_execfile.py", line 18, in execfile
exec(compile(contents+"\n", file, 'exec'), glob, loc)
File "C:/Users/Pc/PycharmProjects/Csv_wr/csv_wr.py", line 10, in <module>
z = df.loc[df['2100'] == 0.0]
File "C:\Users\Pc\PycharmProjects\Csv_wr\venv \lib\site-packages\pandas\core\frame.py", line 4090, in __getitem__
indexer = self.columns.get_loc(key)
File "C:\Users\Pc\PycharmProjects\Csv_wr\venv \lib\site-packages\pandas\core\indexes\range.py", line 417, in get_loc
raise KeyError(key)
KeyError: '2100'


В итоге у меня два вопроса к уважаемым форумчанам. Почему может не работать df.loc[] и возможно ли другие решения этой задачи?
0
Лучшие ответы (1)
Programming
Эксперт
39485 / 9562 / 3019
Регистрация: 12.04.2006
Сообщений: 41,671
Блог
06.03.2024, 16:41
Ответы с готовыми решениями:

Отфильтровать из строки числа
Вводится строка, содержащая буквы, целые неотрицательные числа и иные символы. Требуется все числа, которые встречаются в строке, поместить...

Access Отфильтровать строки в бд
В запросе пытаюсь отфильтровать таблицу. Нужно посчитать сумму всех ячеек в столбике и вывести только те строки, число которых в столбике...

Отфильтровать из строки числа
Вводится строка, содержащая буквы, целые неотрицательные числа и иные символы. Требуется все числа, которые встречаются в строке, поместить...

5
Эксперт Python
8849 / 4501 / 1864
Регистрация: 27.03.2020
Сообщений: 7,316
06.03.2024, 17:37
NSEb22,
Почему может не работать df.loc[]
Потому что нет столбца ‘2100’
возможно ли другие решения этой задачи?
Да. Непонятно:
представить эти данные в виде 2д массива (списка) с чередующимися значениями типов данных
По сколько элементов в строке?


Порядок в наборе данных важен, а порядок строк в массиве нет
Это как? Выше Вами сказано «чередующимися»

Добавлено через 2 минуты
И желательна хотя бы часть реальных данных, и что на выходе на основе этой части нужно получить с учетом «лишние отбросить» и «сколько элементов в строке»
0
0 / 0 / 0
Регистрация: 10.09.2021
Сообщений: 15
06.03.2024, 17:58  [ТС]
Здравствуйте. Реальный файл данных прилагаю. Нужно его поделить на 200 строк и заполнить ими 2D список таким образом чтобы их последний элемент [2100], в допустим, нечетных строках массива имел значение 0.0, а в четных 0.99. Не знаю как проще обьяснить. В программе я примерно показал что хотел. Вначале весь набор поделил на 2d списки в одном из которых строки с 0.0 в [2100] и а в другом строки с 0.99 в [2100]. А потом соединить его в один чередуя строку с 0, потом с 0.99. Лишние нулевые строки отбрасываем.
Вложения
Тип файла: zip prover.zip (3.39 Мб, 3 просмотров)
0
0 / 0 / 0
Регистрация: 10.09.2021
Сообщений: 15
06.03.2024, 20:13  [ТС]
Цитата Сообщение от NSEb22 Посмотреть сообщение
Почему может не работать df.loc[]
Я попробовал с помощью NumPy перевести данные из файла prover.txt в массив 2D 200Х2101 как есть без сортировки. И записать их на диск. Вот теперь если читать их с диска с помощью pandas (без NumPy) то и .loc[] работает. Видимо структуре DataFrame после NumPy чего то не хватает. А как дописать данные в структуру я пока не знаю. Ну пока будет работать через запись-чтение.
0
Эксперт Python
8849 / 4501 / 1864
Регистрация: 27.03.2020
Сообщений: 7,316
06.03.2024, 20:31
Лучший ответ Сообщение было отмечено NSEb22 как решение

Решение

NSEb22, Так?
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
import numpy as np
import pandas as pd
 
 
data = np.loadtxt('/content/drive/MyDrive/prover.txt') # путь укажите свой
 
n = len(data)//2101
data = data.reshape(n, 2101)
 
df = pd.DataFrame(data)
col = df.columns[-1]
df.sort_values(by=[col], inplace=True, ignore_index=True)
 
k = len(df[df[col]==0.99])
arr0 = df.iloc[:k, :].to_numpy()
arr1 = df.iloc[-k:, :].to_numpy()
result = np.column_stack((arr0,arr1)).reshape(2*k, 2101)
print(result)
Добавлено через 6 минут
Или:
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
import numpy as np
import pandas as pd
 
 
data = np.loadtxt('/content/drive/MyDrive/prover.txt')
 
n = len(data)//2101
data = data.reshape(n, 2101)
 
df = pd.DataFrame(data)
col = df.columns[-1]
 
arr1 = df[df[col]==.99].to_numpy()
k = len(arr1)
arr0 = df[df[col]==0.0].to_numpy()[:k]
result = np.column_stack((arr0,arr1)).reshape(2*k, 2101)
print(result)
0
0 / 0 / 0
Регистрация: 10.09.2021
Сообщений: 15
06.03.2024, 21:29  [ТС]
Спасибо.
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
inter-admin
Эксперт
29715 / 6470 / 2152
Регистрация: 06.03.2009
Сообщений: 28,500
Блог
06.03.2024, 21:29
Помогаю со студенческими работами здесь

Отфильтровать из строки числа
Вводится строка, содержащая буквы, целые неотрицательные числа и иные символы. Требуется все числа, которые встречаются в строке, поместить...

Как отфильтровать строки в DataGridView?
У меня есть .Net приложение с WinForms. В нём есть объект System.Windows.Forms.DataGridView с datasource в виде BindingSource -&gt;...

Отфильтровать строки из 1.txt по критерию
Например есть следующий код &lt;variable name=&quot;count&quot; type=&quot;int&quot;&gt;1&lt;/variable&gt; &lt;variable name=&quot;data&quot;...

Отфильтровать и копировать строки в Excel
есть таблица, где нужно отфилтровать и копировать строки видео с примером MUkDG6-FxQE

Отфильтровать пустые строки файла
Есть 10 label'oв в них из file.txt случайным образом заносятся 10 строчек (10 label's = 10 строчек) в file.txt ~180 строчек, среди них...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
6
Ответ Создать тему
Новые блоги и статьи
http://iceja.net/ математические сервисы
iceja 20.01.2026
Обновила свой сайт http:/ / iceja. net/ , приделала Fast Fourier Transform экстраполяцию сигналов. Однако предсказывает далеко не каждый сигнал (см ограничения http:/ / iceja. net/ fourier/ docs ). Также. . .
http://iceja.net/ сервер решения полиномов
iceja 18.01.2026
Выкатила http:/ / iceja. net/ сервер решения полиномов (находит действительные корни полиномов методом Штурма). На сайте документация по API, но скажу прямо VPS слабенький и 200 000 полиномов. . .
Расчёт переходных процессов в цепи постоянного тока
igorrr37 16.01.2026
/ * Дана цепь постоянного тока с R, L, C, k(ключ), U, E, J. Программа составляет систему уравнений по 1 и 2 законам Кирхгофа, решает её и находит: токи, напряжения и их 1 и 2 производные при t = 0;. . .
Восстановить юзерскрипты Greasemonkey из бэкапа браузера
damix 15.01.2026
Если восстановить из бэкапа профиль Firefox после переустановки винды, то список юзерскриптов в Greasemonkey будет пустым. Но восстановить их можно так. Для этого понадобится консольная утилита. . .
Сукцессия микоризы: основная теория в виде двух уравнений.
anaschu 11.01.2026
https:/ / rutube. ru/ video/ 7a537f578d808e67a3c6fd818a44a5c4/
WordPad для Windows 11
Jel 10.01.2026
WordPad для Windows 11 — это приложение, которое восстанавливает классический текстовый редактор WordPad в операционной системе Windows 11. После того как Microsoft исключила WordPad из. . .
Classic Notepad for Windows 11
Jel 10.01.2026
Old Classic Notepad for Windows 11 Приложение для Windows 11, позволяющее пользователям вернуть классическую версию текстового редактора «Блокнот» из Windows 10. Программа предоставляет более. . .
Почему дизайн решает?
Neotwalker 09.01.2026
В современном мире, где конкуренция за внимание потребителя достигла пика, дизайн становится мощным инструментом для успеха бренда. Это не просто красивый внешний вид продукта или сайта — это. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru