0 / 0 / 0
Регистрация: 01.05.2015
Сообщений: 4
1

Простой парсер xls или csv

13.05.2015, 14:23. Показов 7672. Ответов 20
Метки нет (Все метки)

Author24 — интернет-сервис помощи студентам
Прошу помощи в решении задачи.

Надо xls файл (либо csv, который получается из этого xls) прочитать построчно с занесением в отдельные переменные значений каждой ячейки.
В каждой строке - 14 ячеек (может когда-то измениться).
Дальше, в цикле внешней утилите (скажем, myutil.exe) надо передать некие из этих параметров и дождаться окончания ее работы, после чего прочитать следующую строку из xls/csv.
Строк может быть несколько тысяч...

Писать простые .bat умел лет 25 назад, но время ушло на несвязанные с програмированием вещи...

Спасибо.
0
Programming
Эксперт
94731 / 64177 / 26122
Регистрация: 12.04.2006
Сообщений: 116,782
13.05.2015, 14:23
Ответы с готовыми решениями:

Конвертация json в csv или xls
Добрый день, необходимо конвертировать файл json в табличный вид. On-line конверторы не подходят,...

Экспорт из phpmyadmin в csv или xls
Экспорт из phpmyadmin в csv или xls есть ли у кого рабочий код?

Как объединить 2 файла CSV или XLS в 1
Здравствуйте. Возникла необходимость в автоматическом режиме (с помощью макроса или еще как)...

Выгрузка данных со страницы в xls или csv
Добрый день. Поставил себе задачу выгружать данные со страницы в таблицу, которую с удовольствием...

20
Эксперт WindowsАвтор FAQ
17996 / 7697 / 892
Регистрация: 25.12.2011
Сообщений: 11,470
Записей в блоге: 16
13.05.2015, 16:18 2
Schtirliz, давайте более конкретней, какие именно ячейки. Желательно пример XLS файла (или csv),
а также пример вызова myutil.exe с передачей аргументов (для любой строки приложенного примера).
1
0 / 0 / 0
Регистрация: 01.05.2015
Сообщений: 4
13.05.2015, 18:40  [ТС] 3
Вот такой пример xls:
Из него надо последовательно выбрать из каждой строки следующие ячейки:
FileName, BrandName, Name2, Sum1, Sum2, Attrib2, Attrib4

командная строка для обработки должна быть такой:

myutil.exe -param0 (номер строки начала обработки, по умолчанию = 1) -param1 Filename -param2 BrandName -param3 Name2 -param4 Attrib2 -param5 (if Attrib4=0 then Sum1 OR then Sum2) -param6 (if Attrib4=0 then "AAA" OR then "BBB")

после окончания работы myutil проверить возвращаемый %errorlevel% и если он равен 0 - то перейти к обработке следующей строки, если не равен - сделать goto на обработчики ошибок (это я сам вроде сделал...)


Спасибо за помощь.
Вложения
Тип файла: xls Example0.xls (15.0 Кб, 16 просмотров)
0
5983 / 1992 / 323
Регистрация: 10.12.2013
Сообщений: 6,863
15.05.2015, 17:31 4
Цитата Сообщение от Schtirliz Посмотреть сообщение
Писать простые .bat умел лет 25 назад
т.е, до заброски в Германию?
1
0 / 0 / 0
Регистрация: 01.05.2015
Сообщений: 4
15.05.2015, 22:50  [ТС] 5
Эта реплика как-то касается данной темы?
0
5983 / 1992 / 323
Регистрация: 10.12.2013
Сообщений: 6,863
16.05.2015, 04:15 6
Цитата Сообщение от Schtirliz Посмотреть сообщение
Эта реплика как-то касается данной темы?
как разведчик разведчику скажу, мелочей нет, важно буквально всё.

Ну а реализацию задачи разбора xls / csv, да и всего остального, впрочем, тоже, я бы выполнил с помощью
настоящих инструментальных средств*, которые приняли на вооружение вместо ватников, пока Schtirliz mit Kat бились за победу в тылу врага.

* perl, powershell, python.

у всех вышеупомянутых языков есть удобные средства для работы с xls и csv.

а строк в файле может быть хоть сто тыщ, не сильно замедлит.
1
Эксперт Python
5418 / 3842 / 1214
Регистрация: 28.10.2013
Сообщений: 9,554
Записей в блоге: 1
16.05.2015, 11:46 7
Пробовал решить данный вопрос через powershell (в котором у меня пока весьма скромная практика)- думал, что все получилось, когда тестил на своем файле из двух строк. Однако на предложенном Example0.xls скрипт не работает, так как файл почему-то разбивается (через объект excel.application) в csv не на две, а на четыре строки, что рушит всю дальнейшую логику извлечения значений по индексам из массива, куда упаковывается каждое значение строки разделенной по точке с запятой.
Адресуйте свой вопрос в раздел по powershell - возможно, там решение будет скорей найдено.
1
251 / 239 / 16
Регистрация: 31.12.2009
Сообщений: 324
16.05.2015, 14:55 8
Лучший ответ Сообщение было отмечено Schtirliz как решение

Решение

Цитата Сообщение от volodin661 Посмотреть сообщение
как разведчик разведчику скажу ...
это была страшная военная тайна - теперь чтобы искупить вину перед Родиной заставят переписывать ядро линукса на повершелле

Schtirliz, на vbs ваш скрипт будет примерно таким:
Кликните здесь для просмотра всего текста
Visual Basic
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
Dim objXL, objWSH, objA, strFName, objSheet, nRow, strA
 
strFName = "C:\Documents and Settings\u0\Рабочий стол\Example0.xls"
 
 
Set objXL = CreateObject("Excel.Application")
Set objWSH = CreateObject("WScript.Shell")
 
'objXL.Visible = False
 
objXL.Workbooks.Open strFName
 
Set objSheet = objXL.ActiveWorkbook.Worksheets(1)
 
 
nRow = 1
 
Do While objSheet.Cells(nRow, 1).Value <> ""
 
'myutil.exe -param0 (номер строки начала обработки, по умолчанию = 1)
'           -param1 Filename
'           -param2 BrandName
'           -param3 Name2
'           -param4 Attrib2
'           -param5 (if Attrib4=0 then Sum1 OR then Sum2)
'           -param6 (if Attrib4=0 then "AAA" OR then "BBB")
 
        strA = strA & "myutil.exe " & vbCRLF
        strA = strA & " -param0 " & CStr(nRow) & vbCRLF
        strA = strA & " -param1 " & Trim(objSheet.Cells(nRow, 19).Value) & vbCRLF
        strA = strA & " -param2 " & Trim(objSheet.Cells(nRow,  5).Value) & vbCRLF
        strA = strA & " -param3 " & Trim(objSheet.Cells(nRow,  7).Value) & vbCRLF
        strA = strA & " -param4 " & Trim(objSheet.Cells(nRow, 18).Value) & vbCRLF
 
        If (Trim(objSheet.Cells(nRow, 21).Value) = "0") Then
                strA = strA & " -param5 " & Trim(objSheet.Cells(nRow, 16).Value) & vbCRLF
                strA = strA & " -param6 AAA"
        Else
                strA = strA & " -param5 " & Trim(objSheet.Cells(nRow, 17).Value) & vbCRLF
                strA = strA & " -param6 BBB"
        End If
 
MsgBox strA
 
        Set objA = objWSH.Exec(Replace(strA, vbCRLF, ""))
 
        If objA.ExitCode <> 0 Then
                MsgBox("фигня в строке #" & nRow & vbCRLF & strA & vbCRLF & "вылетаем")
                Exit Do
        End If
 
        Set objA = Nothing
 
    nRow = nRow + 1
        strA = ""
Loop
 
 
objXL.ActiveWindow.Close
objXL.Quit
4
Эксперт WindowsАвтор FAQ
17996 / 7697 / 892
Регистрация: 25.12.2011
Сообщений: 11,470
Записей в блоге: 16
16.05.2015, 19:44 9
Лучший ответ Сообщение было отмечено Schtirliz как решение

Решение

Или тоже самое через драйвер базы данных:

Visual Basic
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
Option Explicit
Dim cnn, rst, objWSH, strFName, strA, objA
 
strFName = "h:\_VBA\База данных\Jet.OLEDB\3\Example0.xls"
 
Set objWSH = CreateObject("WScript.Shell")
Set cnn = CreateObject("adodb.Connection")
Set rst = CreateObject("adodb.Recordset")
 
' Если установлена 64-разрядная версия Excel -> закомментировать этот блок
if GetOSBitness() = "x64" then
    if instr(1, Wscript.FullName, "SysWow64", 1) = 0 then
        Dim vbHost: vbHost = CreateObject("Scripting.FileSystemObject").GetBaseName(Wscript.FullName)
        objWSH.Run """" & objWSH.ExpandEnvironmentStrings("%SystemRoot%") & "\SysWow64\" & vbHost & ".exe""" & " //nologo " & """" & WScript.ScriptFullName & """", 1, false
        WScript.Quit
    end if
end if
 
'для Excel 97/2003
cnn.Open "Driver={Microsoft Excel Driver (*.xls)};DBQ=" & strFName
'для Excel 2007 и выше
'cnn.Open "Driver={Microsoft Excel Driver (*.xls, *.xlsx, *.xlsm, *.xlsb)};DBQ=" & strFName
rst.Open "SELECT * FROM [Лист1$A1:U]", cnn, 3, 1 '3 - adOpenStatic, 1 - adLockReadOnly
 
with rst
    Do until .EOF or .BOF
        if Len(GetValue("A")) = 0 then Exit Do
        
        strA = "myutil.exe " & vbCRLF
        strA = strA & " -param0 " & GetValue("A") & vbCRLF ' -param0 (номер строки начала обработки, по умолчанию = 1)
        strA = strA & " -param1 " & GetValue("S") & vbCRLF ' -param1 Filename
        strA = strA & " -param2 " & GetValue("E") & vbCRLF ' -param2 BrandName
        strA = strA & " -param3 " & GetValue("G") & vbCRLF ' -param3 Name2
        strA = strA & " -param4 " & GetValue("R") & vbCRLF ' -param4 Attrib2
 
        If GetValue("U") = "0" Then
                strA = strA & " -param5 " & GetValue("P") & vbCRLF ' -param5 (if Attrib4=0 then Sum1, otherwise Sum2)
                strA = strA & " -param6 AAA"                       ' -param6 (if Attrib4=0 then "AAA", otherwise "BBB")
        Else
                strA = strA & " -param5 " & GetValue("Q") & vbCRLF
                strA = strA & " -param6 BBB"
        End If
 
        MsgBox strA
 
        Set objA = objWSH.Exec(Replace(strA, vbCRLF, ""))
 
        If objA.ExitCode <> 0 Then
                MsgBox("Проблемы в строке #" & GetValue("A") & vbCRLF & strA & vbCRLF & "вылетаем")
                Exit Do
        End If
        
        .MoveNext
    Loop
end with
 
rst.Close: cnn.Close
 
Function GetValue(ColumnName): GetValue = Trim(rst.Fields(ASC(UCase(ColumnName))-65)): End Function
 
Function GetOSBitness()
    GetOSBitness = "x64": If objWSH.ExpandEnvironmentStrings("%PROCESSOR_ARCHITECTURE%") = "x86" and objWSH.ExpandEnvironmentStrings("%PROCESSOR_ARCHITEW6432%") = "%PROCESSOR_ARCHITEW6432%" then GetOSBitness = "x32"
End Function
4
2618 / 548 / 109
Регистрация: 21.03.2012
Сообщений: 1,051
16.05.2015, 23:26 10
buggydancer, совет: вместо операции сравнения вида Cells(nRow, 1).Value <> "" лучше использовать функцию IsEmpty(Cells(nRow, 1).Value), т.к. она работает быстрее.
3
0 / 0 / 0
Регистрация: 01.05.2015
Сообщений: 4
17.05.2015, 11:09  [ТС] 11
Большое спасибо за помощь buggydancer, Dragokas!
0
251 / 239 / 16
Регистрация: 31.12.2009
Сообщений: 324
17.05.2015, 14:43 12
Цитата Сообщение от Dmitrii Посмотреть сообщение
совет: вместо операции сравнения вида Cells(nRow, 1).Value <> "" лучше использовать функцию IsEmpty(Cells(nRow, 1).Value), т.к. она работает быстрее.
Спасибо! давно я с Экселем не работал - все забыл.

Цитата Сообщение от volodin661 Посмотреть сообщение
... а строк в файле может быть хоть сто тыщ ...
может в современном Excel это и так, просто раньше 65535 (2^16) строк был предел (если конечно я опять ничего не путаю) тут-то IsEmpty() очень пригодится

Schtirliz, всегда пожалуйста!
1
Эксперт WindowsАвтор FAQ
17996 / 7697 / 892
Регистрация: 25.12.2011
Сообщений: 11,470
Записей в блоге: 16
17.05.2015, 14:46 13
Цитата Сообщение от buggydancer Посмотреть сообщение
может в современном Excel это и так
1 048 576 строк и 16 384 столбца



А в 2003 так и есть: 65536 х 256.
2
2618 / 548 / 109
Регистрация: 21.03.2012
Сообщений: 1,051
17.05.2015, 16:27 14
Цитата Сообщение от Dmitrii Посмотреть сообщение
вместо операции сравнения вида Cells(nRow, 1).Value <> "" лучше использовать функцию IsEmpty(Cells(nRow, 1).Value)
Совсем забыл о том, что в ячейке может находиться формула, возвращающая пустую строку. В этом случае использование выражения Cells(nRow, 1).Value <> "" становится вполне приемлемым вариантом.
2
5983 / 1992 / 323
Регистрация: 10.12.2013
Сообщений: 6,863
18.05.2015, 01:36 15
Если есть такая возможность,
предпочту сохранение в CSV разборке XLS,
пусть уж они( майкрософтовские индусы) сами решат проблемы пустых ячеек и всяких привязанных к ней форматов,
а мне достанется несложный разбор текстового файла с разделителями.
2
251 / 239 / 16
Регистрация: 31.12.2009
Сообщений: 324
18.05.2015, 20:38 16
Цитата Сообщение от volodin661 Посмотреть сообщение
... предпочту сохранение в CSV разборке XLS ...
Безусловно текстовый файл разбирать привычнее (да и приятнее что-ли) только вот сталкивался с CSV (правда из 1С а не из Excel) в котором и разделитель то уникальный нельзя было поставить - в полях была вся печатная часть ASCII - пришлось делать 2 CSV с разными разделителями чтобы потом их сопоставлять для неоднозначных строк (это было когда наш 1С-ник не участвовал - приходилось выкручиваться самому)
1
Эксперт WindowsАвтор FAQ
17996 / 7697 / 892
Регистрация: 25.12.2011
Сообщений: 11,470
Записей в блоге: 16
18.05.2015, 22:20 17
В CSV есть один большой минус: не все редакторы поддерживают юникодный CSV, когда он бывает очень нужен (в частности этим страдает и пакет MS Office).
3
5983 / 1992 / 323
Регистрация: 10.12.2013
Сообщений: 6,863
19.05.2015, 04:53 18
1C
1
Не постесняюсь спросить: зачем нужен 'редактор' при программном разборе  файлoв типа CSV?
0
Эксперт WindowsАвтор FAQ
17996 / 7697 / 892
Регистрация: 25.12.2011
Сообщений: 11,470
Записей в блоге: 16
19.05.2015, 10:16 19
Например при грамотном выборе инструмента для
Цитата Сообщение от volodin661 Посмотреть сообщение
сохранение в CSV
чтобы не потерять часть данных.
0
5983 / 1992 / 323
Регистрация: 10.12.2013
Сообщений: 6,863
19.05.2015, 21:42 20
Dragokas, может я непонятно формулирую ?

сохраняет XLS в CSV сам Excel,
то есть, если переходить на личности,
сами разработчики данного продукта и кому как не им знать,
как правильно обработать значения в ячейках при переводе их в простой текстовый вид,
который доступен для разбора и слону, и даже маленькой улитке.
0
19.05.2015, 21:42
IT_Exp
Эксперт
87844 / 49110 / 22898
Регистрация: 17.06.2006
Сообщений: 92,604
19.05.2015, 21:42
Помогаю со студенческими работами здесь

Как вывести прайслист в формате xls или csv из 1С
День добрый! Подскажите пожалуйста как проще всего вывести прайслист в формате xls или csv из...

Импорт данных из xls или csv файла в БД MySql C#
Очень нужна помощь. Есть большой объем данных(файлы xls,csv) которые нужно импортировать через...

Exel(csv) в xls
Необходимо из таблицы с данными, генерировать xml файл. Все готовые сервисы генерируют только:...

Сохранение xls в csv
Здравствуйте. В общем просто руками сохранять в csv из xls я умею. Хочу узнать реально ли это...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
20
Ответ Создать тему
Опции темы

КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2024, CyberForum.ru