|
0 / 0 / 0
Регистрация: 14.11.2013
Сообщений: 23
|
||||||
Разделение большого текста из файла на токены15.06.2014, 20:38. Показов 4958. Ответов 7
Метки нет (Все метки)
Всем привет!
Читаю питоном текстовый документ и нигде не могу найти, как его разделить на токены.
0
|
||||||
| 15.06.2014, 20:38 | |
|
Ответы с готовыми решениями:
7
Разделение большого файла Разделение файла с большого на мелкие Разделение большого Excel файла н |
|
842 / 480 / 58
Регистрация: 18.09.2012
Сообщений: 1,688
|
||||||
| 16.06.2014, 01:51 | ||||||
|
Askania, ну без регулярок вообще говоря можно:
Askania, ну а вообще да, есть такое в модуле re/
1
|
||||||
|
6 / 6 / 1
Регистрация: 13.12.2015
Сообщений: 398
|
|
| 22.03.2017, 07:27 | |
|
Wolkodav, скажите пожалуйста, а как учесть окончания? Чтобы читал слово день как дни, дня. Это был один токен
0
|
|
|
440 / 432 / 159
Регистрация: 21.05.2016
Сообщений: 1,338
|
|
| 22.03.2017, 07:32 | |
|
0
|
|
|
6 / 6 / 1
Регистрация: 13.12.2015
Сообщений: 398
|
|
| 22.03.2017, 07:35 | |
|
oldnewyear, тогда текст разобьется просто на токены. Дни и день будут считаться разными токенами. Как бы словарь подцепить. Если токен похож на дни это токен день, т.е. заменить все токены (дни, день, дня) на токен день
0
|
|
|
440 / 432 / 159
Регистрация: 21.05.2016
Сообщений: 1,338
|
|
| 22.03.2017, 10:55 | |
|
0
|
|
|
|
||
| 22.03.2017, 13:21 | ||
|
Обработка естественного языка на Python
0
|
||
|
6 / 6 / 1
Регистрация: 13.12.2015
Сообщений: 398
|
|
| 23.03.2017, 23:42 | |
|
Garry Galler, подскажите пожалуйста с чего начать. Сделал код, который ищет к первому предложению самое близкое по словам. Нужно определить тему каждому отрывку. Исходник файл excel столбец. С чего начать
0
|
|
| 23.03.2017, 23:42 | |
|
Помогаю со студенческими работами здесь
8
Разделение на текстовые токены Разделение строки на токены Разделение большого файла на несколько маленьких потоками Разделение большого файла на несколько маленьких c потоками Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
|||
|
Символьное дифференцирование
igorrr37 13.02.2026
/ *
Логарифм записывается как: (x-2)log(x^2+2) - означает логарифм (x^2+2) по основанию (x-2).
Унарный минус обозначается как !
в-строка - входное арифметическое выражение в инфиксной(обычной). . .
|
Камера Toupcam IUA500KMA
Eddy_Em 12.02.2026
Т. к. у всяких "хикроботов" слишком уж мелкий пиксель, для подсмотра в ESPriF они вообще плохо годятся: уже 14 величину можно рассмотреть еле-еле лишь на экспозициях под 3 секунды (а то и больше),. . .
|
И ясному Солнцу
zbw 12.02.2026
И ясному Солнцу,
и светлой Луне.
В мире
покоя нет
и люди
не могут жить в тишине.
А жить им немного лет.
|
«Знание-Сила»
zbw 12.02.2026
«Знание-Сила»
«Время-Деньги»
«Деньги -Пуля»
|
|
SDL3 для Web (WebAssembly): Подключение Box2D v3, физика и отрисовка коллайдеров
8Observer8 12.02.2026
Содержание блога
Box2D - это библиотека для 2D физики для анимаций и игр. С её помощью можно определять были ли коллизии между конкретными объектами и вызывать обработчики событий столкновения. . . .
|
SDL3 для Web (WebAssembly): Загрузка PNG с прозрачным фоном с помощью SDL_LoadPNG (без SDL3_image)
8Observer8 11.02.2026
Содержание блога
Библиотека SDL3 содержит встроенные инструменты для базовой работы с изображениями - без использования библиотеки SDL3_image. Пошагово создадим проект для загрузки изображения. . .
|
SDL3 для Web (WebAssembly): Загрузка PNG с прозрачным фоном с помощью SDL3_image
8Observer8 10.02.2026
Содержание блога
Библиотека SDL3_image содержит инструменты для расширенной работы с изображениями. Пошагово создадим проект для загрузки изображения формата PNG с альфа-каналом (с прозрачным. . .
|
Установка Qt-версии Lazarus IDE в Debian Trixie Xfce
volvo 10.02.2026
В общем, достали меня глюки IDE Лазаруса, собранной с использованием набора виджетов Gtk2 (конкретно: если набирать текст в редакторе и вызвать подсказку через Ctrl+Space, то после закрытия окошка. . .
|