Форум программистов, компьютерный форум, киберфорум
Python для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.88/34: Рейтинг темы: голосов - 34, средняя оценка - 4.88
-14 / 2 / 0
Регистрация: 28.02.2019
Сообщений: 12

Генерация текстов

01.04.2019, 14:53. Показов 7864. Ответов 4
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Сервис Яндекс.Рефераты (https://yandex.ru/referats/) может генерировать абсолютно бессмысленные тексты, корректные с точки зрения русской грамматики. Например, такие:

Реферат по литературоведению
Тема: «Прозаический жанр в XXI веке»

Анализ состава 17 рукописных сборников, содержащих тексты стихотворных фацеций, позволяет сделать вывод о том, что размер прекрасно выбирает скрытый смысл. Парафраз фонетически иллюстрирует лирический ямб. Даже в этом коротком фрагменте видно, что речевой акт теоретически возможен. Графомания, несмотря на внешние воздействия, вразнобой аллитерирует мифопоэтический хронотоп, но языковая игра не приводит к активно-диалогическому пониманию.

Анапест, как справедливо считает И.Гальперин, традиционно редуцирует анжамбеман, несмотря на отсутствие единого пунктуационного алгоритма. Палимпсест, несмотря на то, что все эти характерологические черты отсылают не к единому образу нарратора, нивелирует символ. Мифопорождающее текстовое устройство просветляет лирический одиннадцатисложник. Диахрония, несмотря на внешние воздействия, возможна.

В данном случае можно согласиться с А.А. Земляковским и с румынским исследователем Альбертом Ковачем, считающими, что брахикаталектический стих интуитивно понятен. Размер просветляет словесный не-текст. Очевидно, что заимствование параллельно. Орнаментальный сказ, несмотря на внешние воздействия, дает эпизодический брахикаталектический стих. Диахрония осознаёт анапест.

Есть даже такой синдром — шизофазия, или речевая разорванность. Он выражается в нарушении структуры речи, при котором фразы строятся правильно, однако не несут никакой смысловой нагрузки.

Давайте попробуем написать простейшую программу, которая генерирует подобные предложения.

Возьмем какой-либо текст (большой роман или несколько малых произведений) и составим таблицу: какие слова могут следовать за тем или иным словом.

Например, в рассказах Чехова после слова «сказал» могут встретиться такие слова:
>>> d[’сказал’]
[’саша’, ’придавая’, ’ему’, ’хохоча’, ’он’, ’ниткин’, ’помоев’, ’шестикрылов’, ’гамлет’,
’он’, ’что’, ’он’, ’приказчик’, ’генерал’, ’на’, ’что’, ’все’, ’он’, ’доктор’, ’он’, ’он’, ’он’, ’все’,
’пробкин’, ’помощник’, ’ей’, ’мамаше’, ’вы’, ’пять’, ’он’, ’человек’, ’он’, ’провизор’, ’он’, ’он’, ’он’,
’этого’, ’поручик’, ’кнапс’, ’он’, ’кнапс’, ’вы’, ’ершаков’, ’он’, ’мрачно’, ’он’, ’мне’, ’надоест’, ’мне’,
’узелков’, ’узелков’, ’узелков’, ’шапкин’, ’лакей’, ’что’, ’ну’, ’он’, ’нельзя’, ’ну’, ’сын’,
’он’, ’старик’, ’вам’, ’скажи’, ’он’, ’он’, ’фон’, ’ну’, ’семечкин’, ’сладким’, ’вам’, ’николай’,
’он’, ’клочков’, ’художник’, ’медик’, ’ей’, ’медик’, ’странная’, ’он’, ’он’]


Теперь мы можем построить итерационный процесс: начинаем с какого-нибудь слова и подбираем к нему следующее случайным образом из возможных вариантов. Делаем найденное слово текущим и т.д.

Если мы не будем считать словами знаки препинания, то у нас могут получаться осмысленные предложения, и мы получим «бредогенератор».

Этот метод подробно описан в книге Брайана Кернигана и Роба Пайка «Практика программирования».

По ссылке доступна разделенная на слова и представленная в виде списка слов книга «Путешествия Гулливера» Джонатана Свифта (файл swift.py). Ее можно использовать как источник сведений о порядке слов в русских предложениях. Список называется words, и его можно импортировать из своей программы такой конструкцией:
from swift import words

Примечания

Обратите внимание, что генерируемые предложения должны быть грамматически правильными, простая последовательность слов не подойдет.
0
Programming
Эксперт
39485 / 9562 / 3019
Регистрация: 12.04.2006
Сообщений: 41,671
Блог
01.04.2019, 14:53
Ответы с готовыми решениями:

Генерация текстов
Сервис Яндекс.Рефераты (https://yandex.ru/referats/) может генерировать абсолютно бессмысленные тексты, корректные с точки зрения русской...

Генерация текстов
Сервис Яндекс.Рефераты (https://yandex.ru/referats/) может генерировать абсолютно бессмысленные тексты, корректные с точки зрения русской...

Дешифрование текстов, зашифрованных xor
Подскажите, пожалуйста, как решить задачу: есть несколько шифротекстов, зашифрованных одним ключом. Как расшифровать данные тексты? Xor...

4
1293 / 677 / 367
Регистрация: 07.01.2019
Сообщений: 2,301
01.04.2019, 17:32
Было уже это задание, пользуйтесь поиском
0
69 / 61 / 11
Регистрация: 08.04.2019
Сообщений: 117
08.04.2019, 19:00
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
from random import choice, sample
from string import punctuation
 
 
def generatetext():
    from swift import words as s
    s1 = list(filter(lambda x: x not in punctuation, s))
    s2 = ((' '.join((sample(s1, choice(range(5, 20)))))).lower()).split()
    for i in s2:
        s2.insert(0, i[0].upper() + i[1:])
        break
    s2.remove(s2[1])
    for i in s2:
        if s2.count(i) != 1:
            del s2[' '.join(s2).rfind(i)]
    return ' '.join(s2) + '.'
 
 
def main():
    a = int(input('Сколько бреда надо вывести? '))
    for i in range(a):
        print(generatetext())
 
 
main()
1
-14 / 2 / 0
Регистрация: 28.02.2019
Сообщений: 12
21.04.2019, 11:39  [ТС]
почему-то генерирует бесконечный текст
0
67 / 64 / 3
Регистрация: 02.11.2019
Сообщений: 227
18.02.2020, 16:50
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
from random import choice, sample
from string import punctuation
from swift import words
s = words
 
def generatetext():
    global s
    s1 = list(filter(lambda x: x not in punctuation, s))
    s2 = ((' '.join((sample(s1, choice(range(5, 20)))))).lower()).split()
    for i in s2:
        s2.insert(0, i[0].upper() + i[1:])
        break
    s2.remove(s2[1])
    for i in s2:
        if s2.count(i) != 1:
            del s2[' '.join(s2).rfind(i)]
    return ' '.join(s2) + '.'
 
 
def main():
    a = int(input('Сколько строк бреда надо вывести? '))
    for i in range(a):
        flag = True
        while flag:
            try:
                print(generatetext())
                flag = False
            except IndexError:
                s = words
 
 
main()
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
inter-admin
Эксперт
29715 / 6470 / 2152
Регистрация: 06.03.2009
Сообщений: 28,500
Блог
18.02.2020, 16:50
Помогаю со студенческими работами здесь

Сравнение двух текстов на схожесть по методу Шингла
Ругается в коде, не могу понять что не так сделано. Должно сравнивать 2 текста на схожесть по методу Шингла. # -*- coding: UTF-8 -*- ...

Баллирование текстов
Ребята, подскажите пожалуйста как сделать следующую задачу. Есть таблица text Ball магазин радиоуправляемый машина ...

Классификация текстов
Привет всем, подскажите пожалуйста, как и с чего начать для построения классификатора текста, то есть я я хочу разделить на два класса,...

Классификация текстов
Привет всем! Заинтересовался темой обработки текстов, а в частности классификацией/кластеризацией. В большинстве примеров решения...

Семантический анализ текстов
Есть задача: для заданной уязвимости из БДУ ФСТЭК найти соответствующие ей угрозы из этой же БДУ. Вопрос в принципе изначально стоит,...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
5
Ответ Создать тему
Новые блоги и статьи
SDL3 для Web (WebAssembly): Обработчик клика мыши в браузере ПК и касания экрана в браузере на мобильном устройстве
8Observer8 02.02.2026
Содержание блога Для начала пошагово создадим рабочий пример для подготовки к экспериментам в браузере ПК и в браузере мобильного устройства. Потом напишем обработчик клика мыши и обработчик. . .
Философия технологии
iceja 01.02.2026
На мой взгляд у человека в технических проектах остается роль генерального директора. Все остальное нейронки делают уже лучше человека. Они не могут нести предпринимательские риски, не могут. . .
SDL3 для Web (WebAssembly): Вывод текста со шрифтом TTF с помощью SDL3_ttf
8Observer8 01.02.2026
Содержание блога В этой пошаговой инструкции создадим с нуля веб-приложение, которое выводит текст в окне браузера. Запустим на Android на локальном сервере. Загрузим Release на бесплатный. . .
SDL3 для Web (WebAssembly): Сборка C/C++ проекта из консоли
8Observer8 30.01.2026
Содержание блога Если вы откроете примеры для начинающих на официальном репозитории SDL3 в папке: examples, то вы увидите, что все примеры используют следующие четыре обязательные функции, а. . .
SDL3 для Web (WebAssembly): Установка Emscripten SDK (emsdk) и CMake для сборки C и C++ приложений в Wasm
8Observer8 30.01.2026
Содержание блога Для того чтобы скачать Emscripten SDK (emsdk) необходимо сначало скачать и уставить Git: Install for Windows. Следуйте стандартной процедуре установки Git через установщик. . . .
SDL3 для Android: Подключение Box2D v3, физика и отрисовка коллайдеров
8Observer8 29.01.2026
Содержание блога Box2D - это библиотека для 2D физики для анимаций и игр. С её помощью можно определять были ли коллизии между конкретными объектами. Версия v3 была полностью переписана на Си, в. . .
Инструменты COM: Сохранение данный из VARIANT в файл и загрузка из файла в VARIANT
bedvit 28.01.2026
Сохранение базовых типов COM и массивов (одномерных или двухмерных) любой вложенности (деревья) в файл, с возможностью выбора алгоритмов сжатия и шифрования. Часть библиотеки BedvitCOM Использованы. . .
SDL3 для Android: Загрузка PNG с альфа-каналом с помощью SDL_LoadPNG (без SDL3_image)
8Observer8 28.01.2026
Содержание блога SDL3 имеет собственные средства для загрузки и отображения PNG-файлов с альфа-каналом и базовой работы с ними. В этой инструкции используется функция SDL_LoadPNG(), которая. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru