Форум программистов, компьютерный форум, киберфорум
PHP для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.83/6: Рейтинг темы: голосов - 6, средняя оценка - 4.83
 Аватар для tipahead
2 / 2 / 0
Регистрация: 30.08.2012
Сообщений: 151

Анализ слов на повторы из файла

03.01.2017, 05:29. Показов 1225. Ответов 3
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Здрасте. Есть файл с содержанием:
Светит солнце, наступило утро.
Холодное утро. Утро прошло.
Пытаюсь сравнить все слова друг с другом и вывести результат повторов т.е:

светит = 1
солнце = 1
наступило = 1
утро = 3

Вот попробовал код написать.

PHP
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
<?php
 
 
$file = fopen("book.txt", "r");
$StudentDetails= array();
 
 
 
while (!feof($file)) {
 
$StudentDetails[] = fgets($file);
 
}
 
fclose($file);
 
 
$separated = implode(" ", $StudentDetails);
 
 
 
 
#----- тут не работает т.к не могу вставить для $itog надпись array ------
 
$itog = explode(' ', $separated);
 
$valz = array_count_values($itog);
 
print_r($valz);
 
 
 
 
#----- тут работает как нужно------
$itogzz = array('если', 'раз', 'два', 'три', 'если', 'четыре');
 
$vals = array_count_values($itogzz);
 
print_r($vals);
 
 
echo gettype($itog), "\n";
 
echo gettype($itogzz), "\n";
?>

Суть в том что array_count_values срабатывает если перед массивом написано array как в itogzz, но это array не могу всунуть в $itog. Ну а все эти прыгания с explode и implode, это чтобы массив содержал отдельно каждое слово под индексом, если без этого он их сортирует предложениями целыми.

Добавлено через 2 часа 1 минуту
Вообще хочу такое проделовать с книгами, но пока даже с маленьким файлом не получается
0
Лучшие ответы (1)
Programming
Эксперт
39485 / 9562 / 3019
Регистрация: 12.04.2006
Сообщений: 41,671
Блог
03.01.2017, 05:29
Ответы с готовыми решениями:

С++ Повторы слов!!!
Помогите написать программу и примерно объяснить алгоритм. А то проболел все лекции по строкам, теперь не могу разобраться, хотя программа...

Удалить повторы слов
Нужно удалить повторы слов из текста. Код работает но дого. Я сначала текст копирую в QString. Потом очищаю от лишних символов. ...

Удалить повторы слов
В предложение возможны повторы слов. Удалить эти повторы.

3
1943 / 1768 / 825
Регистрация: 23.01.2014
Сообщений: 6,230
03.01.2017, 09:54
Лучший ответ Сообщение было отмечено tipahead как решение

Решение

tipahead,
PHP
1
2
3
4
5
6
7
8
9
10
11
12
13
<?php
 
/*
Скрипт в кодировке UTF-8
Файл test.txt в кодировке UTF-8
*/
 
$letters = "абвгдеёжзийклмнопрстуфхцчшщъыьэюяАБВГДЕЁЖЗИЙКЛМНОПРСТУФХЦЧШЩЪЫЬЭЮЯ";
$content = file_get_contents("test.txt");
$content = mb_strtolower($content); // Строка нужна, чтобы Утро и утро были разными словами
$words = str_word_count($content, 1, $letters);
$wordCount = array_count_values($words);
echo "<pre>".print_r($wordCount, true)."</pre>";
Code
1
2
3
4
5
6
7
8
9
Array
(
    [светит] => 1
    [солнце] => 1
    [наступило] => 1
    [утро] => 3
    [холодное] => 1
    [прошло] => 1
)
1
 Аватар для tipahead
2 / 2 / 0
Регистрация: 30.08.2012
Сообщений: 151
03.01.2017, 15:54  [ТС]
Да работает всё, а если мне нужно чтобы слова Утро и утро это было одинаковые слова?) Это же и есть одинаковые слова)

Добавлено через 2 часа 6 минут
И как бы отслеживать только русские буквы
0
1943 / 1768 / 825
Регистрация: 23.01.2014
Сообщений: 6,230
03.01.2017, 17:39
Цитата Сообщение от tipahead Посмотреть сообщение
Да работает всё, а если мне нужно чтобы слова Утро и утро это было одинаковые слова?) Это же и есть одинаковые слова)
Я просто неправильно написал комментарий. Эта строка наоборот для того чтобы они были одинаковыми.

Вы бы могли убедиться в этом по результату работы.
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
inter-admin
Эксперт
29715 / 6470 / 2152
Регистрация: 06.03.2009
Сообщений: 28,500
Блог
03.01.2017, 17:39
Помогаю со студенческими работами здесь

посчитать повторы слов
помогите, пожалуйста, написать программу: Дан текст, содержайщий n строк. Для каждого из слов указать, сколько раз оно встречается в тексте.

Анализ текстового файла и отображение в виде графической диаграммы, количества слов, в зависимости от их длины
Добрый день Всем! Нужна помощь в построение диаграмм. Нужно, чтоб программа анализировала текстовый файл и отображала в виде графической...

Запретить повторы слов в наименованиях ТОВАРА
ПОМОГИТЕ ПОЖАЛУЙСТА СДЕЛАТЬ НА PL/SQL

Заменить повторы слов точками. Пояснения к коду
/* Дан текст не более 255 символов. Слова отделяются друг от друга пробелами. * Заменить повторно встречающиеся слова тремя точками. ...

Как запретить повторы слов в наименованиях товара?
Запретить повторы слов в наименованиях ТОВАРА


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
4
Ответ Создать тему
Новые блоги и статьи
PhpStorm 2025.3: WSL Terminal всегда стартует в ~
and_y87 14.12.2025
PhpStorm 2025. 3: WSL Terminal всегда стартует в ~ (home), игнорируя директорию проекта Симптом: После обновления до PhpStorm 2025. 3 встроенный терминал WSL открывается в домашней директории. . .
Access
VikBal 11.12.2025
Помогите пожалуйста !! Как объединить 2 одинаковые БД Access с разными данными.
Новый ноутбук
volvo 07.12.2025
Всем привет. По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне: Ryzen 5 7533HS 64 Gb DDR5 1Tb NVMe 16" Full HD Display Win11 Pro
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
Поиск "дружественных имён" СОМ портов
Argus19 22.11.2025
Поиск "дружественных имён" СОМ портов На странице: https:/ / norseev. ru/ 2018/ 01/ 04/ comportlist_windows/ нашёл схожую тему. Там приведён код на С++, который показывает только имена СОМ портов, типа,. . .
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Programma_Boinc 20.11.2025
Сколько Государство потратило денег на меня, обеспечивая инсулином. Вот решила сделать интересный приблизительный подсчет, сколько государство потратило на меня денег на покупку инсулинов. . . .
Ломающие изменения в C#.NStar Alpha
Etyuhibosecyu 20.11.2025
Уже можно не только тестировать, но и пользоваться C#. NStar - писать оконные приложения, содержащие надписи, кнопки, текстовые поля и даже изображения, например, моя игра "Три в ряд" написана на этом. . .
Мысли в слух
kumehtar 18.11.2025
Кстати, совсем недавно имел разговор на тему медитаций с людьми. И обнаружил, что они вообще не понимают что такое медитация и зачем она нужна. Самые базовые вещи. Для них это - когда просто люди. . .
Создание Single Page Application на фреймах
krapotkin 16.11.2025
Статья исключительно для начинающих. Подходы оригинальностью не блещут. В век Веб все очень привыкли к дизайну Single-Page-Application . Быстренько разберем подход "на фреймах". Мы делаем одну. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2025, CyberForum.ru