|
3 / 2 / 1
Регистрация: 15.10.2019
Сообщений: 95
|
||||||
Распарсить строки в CSV файле06.10.2021, 12:27. Показов 6553. Ответов 9
Добрый день! У меня есть некоторый файл с расширением csv. В нём какая-то не совсем явная структура данных и стандартным методом pandas распарсить в лоб не удаётся.
Вот пример струткуры данных из файла csv: PassengerId,Survived,Pclass,Name,Sex,Age ,SibSp,Parch,Ticket,Fare,Cabin,Embarked 1,0,3,"Braund, Mr. Owen Harris",male,22,1,0,A/5 21171,7.25,,S Метод использую следующий:
Как у меня открывается первые несколько строк - прикрепил по вложении.
0
|
||||||
| 06.10.2021, 12:27 | |
|
Ответы с готовыми решениями:
9
Распарсить строки в кавычках в CSV файле
|
|
8851 / 4502 / 1864
Регистрация: 27.03.2020
Сообщений: 7,317
|
||||||
| 06.10.2021, 14:16 | ||||||
|
severe90,
0
|
||||||
|
3 / 2 / 1
Регистрация: 15.10.2019
Сообщений: 95
|
|
| 06.10.2021, 14:27 [ТС] | |
|
Дело в том, что если файл открыть в блокноте, то каждая строка кроме заголовка заключена в кавычки:
PassengerId,Survived,Pclass,Name,Sex,Age ,SibSp,Parch,Ticket,Fare,Cabin,Embarked "1,0,3,""Braund, Mr. Owen Harris"",male,22,1,0,A/5 21171,7.25,,S" "2,1,1,""Cumings, Mrs. John Bradley (Florence Briggs Thayer)"",female,38,1,0,PC 17599,71.2833,C85,C" "3,1,3,""Heikkinen, Miss. Laina"",female,26,0,0,STON/O2. 3101282,7.925,,S" "4,1,1,""Futrelle, Mrs. Jacques Heath (Lily May Peel)"",female,35,1,0,113803,53.1,C123,S " "5,0,3,""Allen, Mr. William Henry"",male,35,0,0,373450,8.05,,S" "6,0,3,""Moran, Mr. James"",male,,0,0,330877,8.4583,,Q" Вот так. Значит как я понимаю, надо сначала считать каждую строку ну и как минимум удалить кавычки в начале и в конце каждой строке. Верно мыслю?
0
|
|
|
8851 / 4502 / 1864
Регистрация: 27.03.2020
Сообщений: 7,317
|
|
| 06.10.2021, 14:41 | |
|
severe90, Да. Убрать кавычки в начале и конце каждой строки. И заменить запятую в поле "Name" или же добавить еще одно поле после "Name" (например "Name_"), а после создания df соединить эти столбцы в один...
0
|
|
|
3 / 2 / 1
Регистрация: 15.10.2019
Сообщений: 95
|
|||||||||||
| 06.10.2021, 15:51 [ТС] | |||||||||||
|
А тогда еще такой вопрос? Могу ли я тут считать все строки например так:
['PassengerId', 'Survived', 'Pclass', 'Name', 'Sex', 'Age', 'SibSp', 'Parch', 'Ticket', 'Fare', 'Cabin', 'Embarked'] ['1,0,3,"Braund, Mr. Owen Harris",male,22,1,0,A/5 21171,7.25,,S'] ['2,1,1,"Cumings, Mrs. John Bradley (Florence Briggs Thayer)",female,38,1,0,PC 17599,71.2833,C85,C'] Или в словарь:
{'PassengerId': '1,0,3,"Braund, Mr. Owen Harris",male,22,1,0,A/5 21171,7.25,,S', 'Survived': None, 'Pclass': None, 'Name': None, 'Sex': None, 'Age': None, 'SibSp': None, 'Parch': None, 'Ticket': None, 'Fare': None, 'Cabin': None, 'Embarked': None} Какой-то из этих вариантов может мне облегчить задачу, например, перезаписыванием данных в новый csv файл, уже с корректным отображением структуры? У меня много вопросов, и иногда может не совсем корректных, но путь к знаниям он такой..
0
|
|||||||||||
|
8851 / 4502 / 1864
Регистрация: 27.03.2020
Сообщений: 7,317
|
|||||||||||
| 06.10.2021, 17:07 | |||||||||||
|
severe90, скорректировать исходный train.csv можно так
Если структура файла, как в примерах:
0
|
|||||||||||
|
3 / 2 / 1
Регистрация: 15.10.2019
Сообщений: 95
|
||||||||
| 07.10.2021, 02:30 [ТС] | ||||||||
|
Да, результат получаестя верный в таком случае:
0
|
||||||||
|
8851 / 4502 / 1864
Регистрация: 27.03.2020
Сообщений: 7,317
|
||||||
| 07.10.2021, 04:27 | ||||||
|
severe90, Если еще не изменял сам файл train.csv, попробуй
0
|
||||||
|
3 / 2 / 1
Регистрация: 15.10.2019
Сообщений: 95
|
|
| 07.10.2021, 06:32 [ТС] | |
|
0
|
|
|
8851 / 4502 / 1864
Регистрация: 27.03.2020
Сообщений: 7,317
|
||||||
| 07.10.2021, 08:32 | ||||||
Сообщение было отмечено severe90 как решение
Решение
severe90, скачал train (4).txt . Обработал
1
|
||||||
| 07.10.2021, 08:32 | |
|
Помогаю со студенческими работами здесь
10
Удаление значения из строки в файле CSV Распарсить файл csv Как распарсить csv файл Распарсить строку csv файла Как в исходном файле CSV удалить строки с "0" в ячейках? Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
|||
|
Оптимизация кода на разграничение прав доступа к элементам формы
Maks 13.04.2026
Алгоритм из решения ниже реализован на нетиповом документе, разработанного в конфигурации КА2.
Задачи, как таковой, поставлено не было, проделанное ниже исключительно моя инициатива.
Было так:. . .
|
Контроль заполнения и очистка дат в зависимости от значения перечислений
Maks 12.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "ПланированиеПерсонала", разработанного в конфигурации КА2.
Задача: реализовать контроль корректности заполнения дат назначения. . .
|
Архитектура слоя интернета для сервера-слоя.
Hrethgir 11.04.2026
В продолжение https:/ / www. cyberforum. ru/ blogs/ 223907/ 10860. html
Знаешь что я подумал? Раз мы все источники пишем в голове ветки, то ничего не мешает добавить в голову такой источник, который сам. . .
|
Подстановка значения реквизита справочника в табличную часть документа
Maks 10.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "ПланированиеПерсонала", разработанного в конфигурации КА2.
Задача: при выборе сотрудника (справочник Сотрудники) в ТЧ документа. . .
|
|
Очистка реквизитов документа при копировании
Maks 09.04.2026
Алгоритм из решения ниже применим как для типовых, так и для нетиповых документов на самых различных конфигурациях.
Задача: при копировании документа очищать определенные реквизиты и табличную. . .
|
модель ЗдравоСохранения 8. Подготовка к разному выполнению заданий
anaschu 08.04.2026
https:/ / github. com/ shumilovas/ med2. git
main ветка * содержимое блока дэлэй из старой модели теперь внутри зайца новой модели
8ATzM_2aurI
|
Блокировка документа от изменений, если он открыт у другого пользователя
Maks 08.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа, разработанного в конфигурации КА2.
Задача: запретить редактирование документа, если он открыт у другого пользователя.
/ / . . .
|
Система безопасности+живучести для сервера-слоя интернета (сети). Двойная привязка.
Hrethgir 08.04.2026
Далее были размышления о системе безопасности. Сообщения с наклонным текстом - мои.
А как нам будет можно проверить, что ссылка наша, а не подделана хулиганами, которая выбросит на другую ветку и. . .
|