Форум программистов, компьютерный форум, киберфорум
Python для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
0 / 0 / 0
Регистрация: 17.06.2022
Сообщений: 1

Приведение текста после pos-tag в нормальный формат

17.06.2022, 14:50. Показов 674. Ответов 0
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Я использовала pos_tag при лемматизации и чистке текста. Помогите, пожалуйста, привести текст в столбце lemm_text в нормальный формат, то есть объединить элементы кортежей в строки. Я новичок в программировании и никак не могу понять, как это сделать. Заранее спасибо!

df['text'] = df['text'].str.lower()

lemmatizer = WordNetLemmatizer()

def clean_text(text):
clean = " ".join(re.sub(r'[^a-zA-z]', ' ', text).lower().split())
word_list = nltk.word_tokenize(clean)
lemmatized_output = ' '.join([lemmatizer.lemmatize(w) for w in word_list])
return lemmatized_output

df['lemm_text'] = df['text'].apply(clean_text)

texts = df['lemm_text'].tolist()
tagged_texts = pos_tag_sents(map(word_tokenize, texts))

df['lemm_text'] = tagged_texts
df.head()

text toxic lemm_text
0 explanation\nwhy the edits made under my usern... 0 [(explanation, NN), (why, WRB), (the, DT), (ed...
1 d'aww! he matches this background colour i'm s... 0 [(d, NN), (aww, NN), (he, PRP), (match, VBZ), ...
2 hey man, i'm really not trying to edit war. it... 0 [(hey, NN), (man, NN), (i, VBZ), (m, VBP), (re...
3 "\nmore\ni can't make any real suggestions on ... 0 [(more, RBR), (i, NNS), (can, MD), (t, VB), (m...
4 you, sir, are my hero. any chance you remember... 0 [(you, PRP), (sir, VBP), (are, VBP), (my, PRP$...
0
Programming
Эксперт
39485 / 9562 / 3019
Регистрация: 12.04.2006
Сообщений: 41,671
Блог
17.06.2022, 14:50
Ответы с готовыми решениями:

Запрос к адресной книге. Приведение адресов в нормальный вид
Всем привет! Только начал заниматься этими ПИТОНАМИ Есть книга эксель, в ней есть столбец с адресом. Необходимо реализовать отправку...

Преобразование Unix timestamp в нормальный формат
Доброе время суток Кто нибудь может подсказать как Unix timestamp формата 1587471720 Преобразовать в 21.04.2020 12:22? Добавлено...

Odd tag in Exec! Odd tag in Cleanup! Odd tag in CreateGroup! UnityEditor.DockArea:OnGUI()
Здравствуйте, столкнулся с такими ошибками Odd tag in Exec! Odd tag in Cleanup! Odd tag in CreateGroup! ...

0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
inter-admin
Эксперт
29715 / 6470 / 2152
Регистрация: 06.03.2009
Сообщений: 28,500
Блог
17.06.2022, 14:50
Помогаю со студенческими работами здесь

Найти "NUGNO" внутри "TAG" с мусором с переходами на строки, выделяя в тч окружающие <TAG> </TAG>
Пример: &lt;TAG мусор NUGNO кака разная&gt; Текст &lt;/TAG&gt; тут переходы на строки, другой код и тд... &lt;TAG мусор NUGNO кака разная&gt;...

Перевод количества секунд в нормальный формат времени
Проблема такая: есть количество секунд, например, 6000 сек, а надо получить время в формате дд:чч:мм:сс. Помню, что где-то попадалась такая...

формат времени число-месяц словом-год назад в нормальный
Есть возможность привести это назад к одному из нормальных форматов?

Как настроить для IIS5 нормальный формат даты - ДД.ММ.ГГГГ?
Проблема при переносе WEB-сервера с IIS4 на IIS5: В Windows2000 , в региональных установках - формат даты ДД.ММ.ГГГГ При выполнении...

Что за формат записи скрипта? И как это преобразовать в нормальный вид?
Доброго всем времени! Юзаю lightview (аналог лайтбокса и колорбокса). В самом скрипте lightview.js основная часть кода записана в одну...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
1
Ответ Создать тему
Новые блоги и статьи
Загрузка PNG-файла с альфа-каналом с помощью библиотеки SDL3_image на Android
8Observer8 27.01.2026
Содержание блога SDL3_image - это библиотека для загрузки и работы с изображениями. Эта пошаговая инструкция покажет, как загрузить и вывести на экран смартфона картинку с альфа-каналом, то есть с. . .
влияние грибов на сукцессию
anaschu 26.01.2026
Бифуркационные изменения массы гриба происходят тогда, когда мы уменьшаем массу компоста в 10 раз, а скорость прироста биомассы уменьшаем в три раза. Скорость прироста биомассы может уменьшаться за. . .
Воспроизведение звукового файла с помощью SDL3_mixer при касании экрана Android
8Observer8 26.01.2026
Содержание блога SDL3_mixer - это библиотека я для воспроизведения аудио. В отличие от инструкции по добавлению текста код по проигрыванию звука уже содержится в шаблоне примера. Нужно только. . .
Установка Android SDK, NDK, JDK, CMake и т.д.
8Observer8 25.01.2026
Содержание блога Перейдите по ссылке: https:/ / developer. android. com/ studio и в самом низу страницы кликните по архиву "commandlinetools-win-xxxxxx_latest. zip" Извлеките архив и вы увидите. . .
Вывод текста со шрифтом TTF на Android с помощью библиотеки SDL3_ttf
8Observer8 25.01.2026
Содержание блога Если у вас не установлены Android SDK, NDK, JDK, и т. д. то сделайте это по следующей инструкции: Установка Android SDK, NDK, JDK, CMake и т. д. Сборка примера Скачайте. . .
Использование SDL3-callbacks вместо функции main() на Android, Desktop и WebAssembly
8Observer8 24.01.2026
Содержание блога Если вы откроете примеры для начинающих на официальном репозитории SDL3 в папке: examples, то вы увидите, что все примеры используют следующие четыре обязательные функции, а. . .
моя боль
iceja 24.01.2026
Выложила интерполяцию кубическими сплайнами www. iceja. net REST сервисы временно не работают, только через Web. Написала за 56 рабочих часов этот сайт с нуля. При помощи perplexity. ai PRO , при. . .
Модель сукцессии микоризы
anaschu 24.01.2026
Решили писать научную статью с неким РОманом
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru