Форум программистов, компьютерный форум, киберфорум
PHP для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.72/29: Рейтинг темы: голосов - 29, средняя оценка - 4.72
2 / 3 / 2
Регистрация: 17.05.2013
Сообщений: 403

Посчитать количество слов или словосочетаний встречающихся в тексте

24.02.2017, 10:30. Показов 5628. Ответов 13
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Добрый день есть текста в бд, их очень много. Мне нужно посчитать общее количество слов в тексте, я не в смысле их посчитать а сколько раз они повторяются в тексте, например есть три текста это упрощенно

1. соня идет домой
2. соня идет пешком
3. соня прикольная
я должен получить ответ соня 3, идет 2, домой, пешком, прикольная 1

это понятно что все будет делаться в цикле меня интересует как взять один текст проверить и записать результат, нужно не учитывать слова из 3-х букв и менее с них толку никакого.

И сразу же нужно проверить на словосочетания из 2-х слов и 3-х слов по предыдущему принципу.
0
Лучшие ответы (1)
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
24.02.2017, 10:30
Ответы с готовыми решениями:

Выделение определённых слов и словосочетаний в тексте
здравствуйте, то что спрашиваю даже и не помню примера где такое есть смысл сделать в предложении часть - два, три слова полями, это...

Посчитать общее количество слов и определить, сколько слов в этом тексте состоит из двух символов
1) Заданы: массив наименований продукции и соответствующие ему данные плановой рентабельности (RP), фактической цены реализации (C) и...

Посчитать количество слов в тексте и длину слов
В программу должен вводиться текст. Нужно: Посчитать кол-во слов в тексте и длину слов и вывести на экран таблицу Длина слова...

13
1943 / 1768 / 825
Регистрация: 23.01.2014
Сообщений: 6,230
24.02.2017, 10:37
botstars, http://php.net/manual/ru/funct... -count.php
0
Эксперт PHP
 Аватар для Kerry_Jr
3106 / 2591 / 1219
Регистрация: 14.05.2014
Сообщений: 7,236
Записей в блоге: 1
24.02.2017, 10:59
pav1uxa, по кодировке не пройдёт
0
2 / 3 / 2
Регистрация: 17.05.2013
Сообщений: 403
24.02.2017, 11:48  [ТС]
Kerry_Jr, что оптимальней использовать текст в ut8?
0
Эксперт PHP
 Аватар для Kerry_Jr
3106 / 2591 / 1219
Регистрация: 14.05.2014
Сообщений: 7,236
Записей в блоге: 1
24.02.2017, 12:10
botstars,
PHP
1
2
3
4
5
$str = 'соня идет домой
 соня идет пешком
 соня прикольная';
$words = array_count_values(preg_split('~\W+~u', $str, -1, PREG_SPLIT_NO_EMPTY));
print_r($words);
1
2 / 3 / 2
Регистрация: 17.05.2013
Сообщений: 403
01.03.2017, 15:10  [ТС]
Kerry_Jr, А как можно что бы регистр не учитывало

Добавлено через 5 минут
интересует как еще проверить на словосочетания 2-x и 3-х слов
0
Эксперт PHP
 Аватар для Kerry_Jr
3106 / 2591 / 1219
Регистрация: 14.05.2014
Сообщений: 7,236
Записей в блоге: 1
01.03.2017, 15:10
Цитата Сообщение от botstars Посмотреть сообщение
А как можно что бы регистр не учитывало
PHP
1
2
3
4
5
$str = 'соня идет домой
 соня идет пешком
 соня прикольная';
$words = array_count_values(array_map('mb_strtolower', preg_split('~\W+~u', $str, -1, PREG_SPLIT_NO_EMPTY)));
print_r($words);
1
2 / 3 / 2
Регистрация: 17.05.2013
Сообщений: 403
01.03.2017, 15:26  [ТС]
Цитата Сообщение от botstars Посмотреть сообщение
интересует как еще проверить на словосочетания 2-x и 3-х слов
в смысле также посчитать

Добавлено через 15 минут
должен получиться вот такой ответ
PHP
1
2
3
4
5
6
7
8
9
10
11
12
13
$array2 = ['соня идет' => 2,
    'идет домой' =>1,
    'домой соня' =>1,
    'идет пешком' =>1,
    'пешком соня' =>1,
    'соня прикольная' =>1];
 
$array3 = ['соня идет домой' => 1,
    'идет домой соня' =>1,
    'домой соня идет' =>1,
    'соня идет пешком' =>1,
    'идет пешком соня' =>1,
    'пешком соня прикольная' =>1];
0
Эксперт PHP
 Аватар для Kerry_Jr
3106 / 2591 / 1219
Регистрация: 14.05.2014
Сообщений: 7,236
Записей в блоге: 1
01.03.2017, 15:34
botstars, составляете словарь(читай массив) словосочетаний, в цикле по нему прогоняете строку
PHP
1
2
3
4
5
6
7
8
$dictionary = ['соня идет', 'идет пешком', 'соня идет домой'];
$str = 'соня Идет домой
 Соня идет пешком
 соня прикольная';
$result = [];
foreach ($dictionary as $item)
    $result[$item] = mb_substr_count(mb_strtolower($str), $item);
print_r($result);
0
2 / 3 / 2
Регистрация: 17.05.2013
Сообщений: 403
01.03.2017, 15:54  [ТС]
нет немного не так я не знаю на какие именно словосочетания мне нужно проверить текст, у меня есть текст, и как и в первом случае нужно подсчитать словосочетания из 2 и 3 слов. Есть только текст
PHP
1
2
3
$str = 'соня Идет домой
 Соня идет пешком
 соня прикольная';
А на выходе я должен получить два массива один из словосочетаний 2-х слов а второй из 3-х слов
PHP
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
//словосочетания из 2-хслов
$array2 = ['соня идет' => 2,
* * 'идет домой' =>1,
* * 'домой соня' =>1,
* * 'идет пешком' =>1,
* * 'пешком соня' =>1,
* * 'соня прикольная' =>1];
 
*//словосочетания из 3-хслов
$array3 = ['соня идет домой' => 1,
* * 'идет домой соня' =>1,
* * 'домой соня идет' =>1,
* * 'соня идет пешком' =>1,
* * 'идет пешком соня' =>1,
* * 'пешком соня прикольная' =>1];
0
Эксперт PHP
 Аватар для Kerry_Jr
3106 / 2591 / 1219
Регистрация: 14.05.2014
Сообщений: 7,236
Записей в блоге: 1
01.03.2017, 17:55
Лучший ответ Сообщение было отмечено botstars как решение

Решение

botstars, как-то так
PHP
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
$str = 'соня Идет домой
 Соня идет пешком
 соня прикольная';
$str_temp = mb_strtolower(preg_replace('~\s+~', ' ', $str));
$words = preg_split('~\W+~u', $str_temp, -1, PREG_SPLIT_NO_EMPTY);
$count = count($words);
$array1 = array_count_values($words);
$array2 = [];
for ($i = 0, $j = 1; $i < $count - 1; ++$i, ++$j) {
    if (isset($words[$i], $words[$j])) {
        $item = $words[$i] . ' ' . $words[$j];
        $array2[$item] = mb_substr_count($str_temp, $item);
    }
}
 
$array3 = [];
for ($i = 0, $j = 1, $k = 2; $i < $count - 2; ++$i, ++$j, ++$k) {
    if (isset($words[$i], $words[$j], $words[$k])) {
        $item = $words[$i] . ' ' . $words[$j] . ' ' . $words[$k];
        $array3[$item] = mb_substr_count($str_temp, $item);
    }
}
var_dump($array1, $array2, $array3);
1
2 / 3 / 2
Регистрация: 17.05.2013
Сообщений: 403
02.03.2017, 15:12  [ТС]
удалил я в тексте все знаки препинания, и символы интересные. Скажите как можно удалить смайлики и прочие знаки как пример вот этот ✅, они же явно к какой-то группе символов относятся если его не находит ваш скрипт, мне они и не нужны вовсе.

Добавлено через 18 часов 52 минуты
Kerry_Jr, а как можно считать слова через дефис одним словом?
0
Эксперт PHP
 Аватар для Kerry_Jr
3106 / 2591 / 1219
Регистрация: 14.05.2014
Сообщений: 7,236
Записей в блоге: 1
02.03.2017, 16:03
Цитата Сообщение от Kerry_Jr Посмотреть сообщение
PHP
1
$words = preg_split('~\W+~u', $str_temp, -1, PREG_SPLIT_NO_EMPTY);
PHP
1
$words = preg_split('~[^\w\-]+~u', $str_temp, -1, PREG_SPLIT_NO_EMPTY);
Добавлено через 3 минуты
Только учтите – если в тексте есть тире написанное знаком -(дефис/минус), то слова, стоящие по разным сторонам дефиса, превратятся в одно слово.
1
2 / 3 / 2
Регистрация: 17.05.2013
Сообщений: 403
09.03.2017, 21:57  [ТС]
Kerry_Jr, почему-то считает немножко не правильно вот текст который есть

классическое отбеливание бамбуковая щетка и отбеливающий мусс достанется случайному подписчику сделавшему репост этой записи и подписавшемуся на white&smile - отбеливание зубов счастливчика узнаем октября


возвращает нули в словосочетаниях

[white amp] => 0
[amp smile] => 0

[на white amp] => 0
[white amp smile] => 0
[amp smile -] => 0
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
09.03.2017, 21:57
Помогаю со студенческими работами здесь

Посчитать количество слов в тексте
Дан текст, состоящий из слов, разделяемых пробелами. Текст заканчивается точкой. Посчитать количество таких слов.

Посчитать количество слов в тексте
2)Задан некоторый текст. Посчитать: a. количество слов b. количество слов, которые начинаются с некоторой заданной буквы c....

Посчитать количество слов в тексте
Здравствуйте. Нужна Ваша помощь. Задачка следующая: Необходимо посчитать количество слов в тексте, который пользователь вводит с...

Подсчитать количество слов в тексте,посчитать количество символов нижнего регистра
Создала программу, которая считает слова, начинающихся и заканчивающиеся одной буквой, но нужно посчитать количество всех букв, и кол-во...

Нужно посчитать количество слов в тексте
Нужно посчитать количество слов в тексте, подкииньте, кто знает какие-то идеи.


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
14
Ответ Создать тему
Новые блоги и статьи
PhpStorm 2025.3: WSL Terminal всегда стартует в ~
and_y87 14.12.2025
PhpStorm 2025. 3: WSL Terminal всегда стартует в ~ (home), игнорируя директорию проекта Симптом: После обновления до PhpStorm 2025. 3 встроенный терминал WSL открывается в домашней директории. . .
Access
VikBal 11.12.2025
Помогите пожалуйста !! Как объединить 2 одинаковые БД Access с разными данными.
Новый ноутбук
volvo 07.12.2025
Всем привет. По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне: Ryzen 5 7533HS 64 Gb DDR5 1Tb NVMe 16" Full HD Display Win11 Pro
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
Поиск "дружественных имён" СОМ портов
Argus19 22.11.2025
Поиск "дружественных имён" СОМ портов На странице: https:/ / norseev. ru/ 2018/ 01/ 04/ comportlist_windows/ нашёл схожую тему. Там приведён код на С++, который показывает только имена СОМ портов, типа,. . .
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Programma_Boinc 20.11.2025
Сколько Государство потратило денег на меня, обеспечивая инсулином. Вот решила сделать интересный приблизительный подсчет, сколько государство потратило на меня денег на покупку инсулинов. . . .
Ломающие изменения в C#.NStar Alpha
Etyuhibosecyu 20.11.2025
Уже можно не только тестировать, но и пользоваться C#. NStar - писать оконные приложения, содержащие надписи, кнопки, текстовые поля и даже изображения, например, моя игра "Три в ряд" написана на этом. . .
Мысли в слух
kumehtar 18.11.2025
Кстати, совсем недавно имел разговор на тему медитаций с людьми. И обнаружил, что они вообще не понимают что такое медитация и зачем она нужна. Самые базовые вещи. Для них это - когда просто люди. . .
Создание Single Page Application на фреймах
krapotkin 16.11.2025
Статья исключительно для начинающих. Подходы оригинальностью не блещут. В век Веб все очень привыкли к дизайну Single-Page-Application . Быстренько разберем подход "на фреймах". Мы делаем одну. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2025, CyberForum.ru