Форум программистов, компьютерный форум, киберфорум
Статистика, теория вероятностей
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 5.00/6: Рейтинг темы: голосов - 6, средняя оценка - 5.00
11 / 0 / 0
Регистрация: 12.01.2015
Сообщений: 4

Вероятность совпадения насосов в двух выборках

12.01.2015, 22:49. Показов 1246. Ответов 8
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Доброго времени суток, господа!

Прошу помощи в решении следующей задачи (цифры условные):

На предприятии есть 150 насосов. За контрольный период выявлено 90 дефектов (естественно, не на всех этих насосах, в то же время на некоторых мог быть не один дефект). За этот же период выявлено 15 остановок насосов (то же самое - некоторые могли останавливаться не один раз).
1. Какова вероятность того, что на насосе, на котором зарегистрировано максимальное количество дефектов, на нём же будет максимальное количество остановок?
2. Какова вероятность того, что три насоса, на которых зарегистрировано максимальное количество дефектов, на них же будет максимальное количество остановок?
3. Какова вероятность того, что на тех 20 % насосов, на которых было зарегистрировано максимальное количество дефектов, будут теми же 20 % насосов, на которых было максимальное количество остановок?

Если это из области теории вероятности/статистики, прошу подсказать путь решения (и/или что почитать) – проштудировала «классическую» вероятность – есть сомнения в части того, что исходы событий равновозможны.. Возможно, что это что-то связанное с числом комбинаций (сочетаний) – произведение событий – но смущает что на некоторых насосах мог быть не один дефект и не одна остановка…
0
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
12.01.2015, 22:49
Ответы с готовыми решениями:

Вероятность совпадения двух чисел
Здравствуйте! Уважаемые знатоки теории вероятности просьба подсказать в следующем вопросе: Есть трехзначное число (допустим 586) и есть...

Вероятность совпадения номера кода
Задача. Чтобы не нарушать закон о персональных данных, ФИО студентов заменены кодом – 4 последними цифрами номера их телефона. Какова...

Вероятность совпадения дня рождения
Как найти вероятность того, что ровно два человека из пяти родились летом? Добавлено через 14 минут А также три из пяти?

8
 Аватар для wowik777
262 / 143 / 13
Регистрация: 18.04.2013
Сообщений: 367
13.01.2015, 00:47
Эту задачу в данной формулировке не решить. Нужны дополнительные условия. Являются ли события наличие дефекта и остановка независимыми? Или есть зависимость? Если есть, то какая?

Каково распределение вероятностей, что на насосе будет дефект или несколько? То же самое для остановок.
1
11 / 0 / 0
Регистрация: 12.01.2015
Сообщений: 4
13.01.2015, 22:49  [ТС]
Спасибо за ответ!

Зависимости нет (там, где был дефект не обязательно будет остановка, и наоборот). Проверила коэффициент корреляции Кендалла 0,398 (с значимостью 0,021), коэффициент корреляции Спирмана 0,597 (с значимостью 0,009).

Как определить распределение вероятностей, что на насосе будет дефект или несколько - прошу подсказать… - правильно ли я понимаю, что для этого необходимо определить закон распределения?
0
 Аватар для wowik777
262 / 143 / 13
Регистрация: 18.04.2013
Сообщений: 367
14.01.2015, 00:17
Нам нужно больше данных о том, что это за задача и что вообще происходит. По-видимому, у тебя есть какие-то данные - скинь их.

Цитата Сообщение от Valeria_2015 Посмотреть сообщение
Проверила коэффициент корреляции Кендалла 0,398 (с значимостью 0,021), коэффициент корреляции Спирмана 0,597 (с значимостью 0,009).
Эти показатели как раз говорят о наличии зависимости. Просто эта зависимость не 100%-ная. Если на каком-то насосе обнаружен дефект, то велика вероятность, что и остановка там же будет. Просто не 100%-ная вероятность, а повышенная.

Цитата Сообщение от Valeria_2015 Посмотреть сообщение
Как определить распределение вероятностей, что на насосе будет дефект или несколько - прошу подсказать… - правильно ли я понимаю, что для этого необходимо определить закон распределения?
Да, правильно понимаешь. Если бы это была задача в институте, то этот закон должен был бы оговариваться в условии. Похоже, что это не институтская задача. Что это?
0
11 / 0 / 0
Регистрация: 12.01.2015
Сообщений: 4
15.01.2015, 06:50  [ТС]
Это режимный объект, цех, в котором на различных позициях стоят насосы (всего 150 шт.). За год было зарегистрировано 94 дефекта и 14 остановок. Необходимо понять, можно ли по выборке дефектов делать выводы об остановках или нет: есть ли зависимость вежду этими событиями, для того, чтобы (условно) не тратить силы на все 150 шт., а сосредоточиться, к примеру, на первых трех или первых 20 %, где наиболее вероятно возникнет остановка.

Выборка взята год – от ремонта до ремонта цеха, т.е. выборка за бОльший период уже будет недостоверна (например, может быть заменён или отремонтирован насос).
Выборка количества дефектов и остановок (указаны условные номера насосов, учитывая конфиденциальность данных):
Номер насоса, на котором произошел дефект:
31
31
23
23
19
26
37
37
9
2
34
23
11
2
34
29
35
35
17
20
14
2
1
1
23
1
32
39
28
27
9
33
7
24
11
6
14
26
23
13
38
40
10
10
10
40
17
2
30
22
21
19
22
23
32
8
19
17
19
3
11
11
12
5
6
19
21
9
37
23
36
9
19
20
21
18
33
38
33
15
25
18
13
18
13
4
2
26
2
4
4
18
16
14
Номер насоса, на котором произошла остановка:
22
41
9
42
42
9
37
37
37
37
9
2
17
2
0
 Аватар для wowik777
262 / 143 / 13
Регистрация: 18.04.2013
Сообщений: 367
15.01.2015, 16:18
Во! Это уже интереснее! Поанализируем. Граждане форумчане, присоединяйтесь!

Добавлено через 3 часа 0 минут
Прикрепляю файлы, где я сагрегировал данные в вид, где напротив каждого номера насоса стоит кол-во дефектов и остановок на нём. Форматы Экселя и для среды SPSS. Форумчане, можете брать прямо эти сагрегированные данные, а не исходные от ТС.
https://yadi.sk/d/6H3tiCNmdzQ9h

Теперь нужно всё это дело проанализировать. Хорошо, что данные чистенькие - безо всяких там пропусков, ошибок и т.д. Должно просто всё быть.
1
 Аватар для wowik777
262 / 143 / 13
Регистрация: 18.04.2013
Сообщений: 367
17.01.2015, 20:15
Valeria_2015, провёл статанализ. Результаты в видео: https://yadi.sk/d/OR807FM9e44oQ

Цитата Сообщение от Valeria_2015 Посмотреть сообщение
1. Какова вероятность того, что на насосе, на котором зарегистрировано максимальное количество дефектов, на нём же будет максимальное количество остановок?
2. Какова вероятность того, что три насоса, на которых зарегистрировано максимальное количество дефектов, на них же будет максимальное количество остановок?
3. Какова вероятность того, что на тех 20 % насосов, на которых было зарегистрировано максимальное количество дефектов, будут теми же 20 % насосов, на которых было максимальное количество остановок?
Думаю, что на эти вопросы отвечать не нужно. Это очень сложно посчитать, если вообще возможно. Да и будет ли польза? Вот получили мы ответ на 1-й вопрос 10%. А это много или мало? А 15% - это много или мало?

Тут нужно использовать коэффициенты корреляции Спирмена, Кендалла. У меня получились другие цифры, чем у тебя.

Будут вопросы - спрашивай.
0
11 / 0 / 0
Регистрация: 12.01.2015
Сообщений: 4
22.01.2015, 22:16  [ТС]
Цитата Сообщение от wowik777 Посмотреть сообщение
Valeria_2015, провёл статанализ. Результаты в видео: https://yadi.sk/d/OR807FM9e44oQ
wowik777, спасибо за расчёты!
Прошу подсказать, правильна ли моя попытка описать/интерпретировать полученные результаты:
Учитывая, что в 88,6% ячейках для 150 насосов (и в 91,4% для 42 насосов) ожидаемая частота меньше 5, то значение хи-квадрат незначимо (нельзя ничего сказать по нему).
Не очень разобралась с d Сомерса, если можешь - подскажи...
Значимость коэффициентов Кендалла и Спирмена достаточно высокая, но сами коэффициенты показывают слабую корреляцию между выборками (это по 150 насосам, а по 42 – вообще очень слабая корреляция) – почему-то доверяю твоим расчётам больше, чем своим
Цитата Сообщение от wowik777 Посмотреть сообщение
Думаю, что на эти вопросы отвечать не нужно. Это очень сложно посчитать, если вообще возможно. Да и будет ли польза? Вот получили мы ответ на 1-й вопрос 10%. А это много или мало? А 15% - это много или мало?
Тут нужно использовать коэффициенты корреляции Спирмена, Кендалла. У меня получились другие цифры, чем у тебя.
Будут вопросы - спрашивай.
По поводу моих пунктов – не очень поняла, почему на эти вопросы отвечать не нужно - потому что сложно посчитать или потому что связь все равно очень слабая и толку не будет?
А если я пойму, как посчитать эти 10 %, то потом смогу посчитать (по аналогии с насосами) и для других групп – например, по трубопроводам. А потом уже посмотрю, 10 % это много или мало (по сравнению с другими группами) … Как-то так…
0
 Аватар для wowik777
262 / 143 / 13
Регистрация: 18.04.2013
Сообщений: 367
23.01.2015, 22:13
Рад помочь!

Цитата Сообщение от Valeria_2015 Посмотреть сообщение
Учитывая, что в 88,6% ячейках для 150 насосов (и в 91,4% для 42 насосов) ожидаемая частота меньше 5, то значение хи-квадрат незначимо (нельзя ничего сказать по нему).
Всё верно.

Цитата Сообщение от Valeria_2015 Посмотреть сообщение
Не очень разобралась с d Сомерса, если можешь - подскажи...
Коэфы сомерса - это по-сути те же коэффы корреляции, но направленные. Например, в математике есть функция игрек от икс F(x)=y(x). Тут х - переменная независимая (факторная), а у - зависимая, ибо она зависит от значений х.

И коэффы сомерса считаются 3 штуки:
1) Когда факторной являются кол-во дефектов - это наш случай.
2) Когда факторной являются кол-во остановок - это очень странный случай
3) Симметричный - это среднее из первых 2-х пунктов.

Все коэффы основные (спирмен, кендалл и т.д) они симметричные - то есть без разделения на факторность и зависимость.

Разные коэффы не всегда можно сравнивать между собой. Например, часто выполняется соотношение, что спирмен примерно в 1,5 раза больше чем кендалл для одних и тех же данных - и это нормально. Гамма - всегда очень высокий.

Цитата Сообщение от Valeria_2015 Посмотреть сообщение
Значимость коэффициентов Кендалла и Спирмена достаточно высокая, но сами коэффициенты показывают слабую корреляцию между выборками (это по 150 насосам, а по 42 – вообще очень слабая корреляция) – почему-то доверяю твоим расчётам больше, чем своим
Для 42-х вообще не смотрим - там неадекват. Для 150 получаем слабо-среднюю связь. Про доверие моим расчётам - это правильно! А как и где ты рассчитывала?
Если провести экспертный опрос и каждому дефекту назначить вес (как я рассказывал в видео), то это значительно повысит коэффы зависимости. А значит, можно будет точнее предсказывать насосы, которые будут останавливаться.

Цитата Сообщение от Valeria_2015 Посмотреть сообщение
По поводу моих пунктов – не очень поняла, почему на эти вопросы отвечать не нужно - потому что сложно посчитать или потому что связь все равно очень слабая и толку не будет?
А если я пойму, как посчитать эти 10 %, то потом смогу посчитать (по аналогии с насосами) и для других групп – например, по трубопроводам. А потом уже посмотрю, 10 % это много или мало (по сравнению с другими группами) … Как-то так…
Смысла нет это рассчитывать. И очень сложно и не нужно одновременно. Если нужно именно рассчитать вероятность остановки для каждого насоса, то обычно это делают с помощью линейной регрессии. Я позже выложу видео с линейной регрессией.

Мы тогда получим оценку типа - если у на на насосе 0 дефектов, то в среднем будет столько-то остановок. А если 6 дефектов, то столько-то. По трубопроводам считать аналогично (если задача аналогичная). То есть коэффы корреляции и линейную регрессию.

По трубопроводам советую так же запостить задачу на форуме отдельной темой + написать мне на почту, скайп, вконтакт (в профиле контакты).

Добавлено через 1 час 46 минут
Вот, видео записал https://yadi.sk/d/1i9IS-oreCL3c
1
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
23.01.2015, 22:13
Помогаю со студенческими работами здесь

Проверка на совпадения двух таблиц БД
Здравствуйте. Я ввожу в текстбокс данные и сохраняю затем это в соответствующие поля таблицы в Access. Как мне проверить допустим...

Вывести совпадения ФИО из двух таблиц
Имеем базу Access с информацией об учащихся студентах. в ней есть поля ФИО, фак-т, группа, и т.д. есть отдельный список с ФИО студентов...

Найти совпадения по номеру документа из двух массивов
Добрый день. Никогда не думала, что придется просить помощи по экселю, обычно проблем не было. Тем не менее. Есть вполне реальная задача...

Сравнение двух столбцов на совпадения ячеек с сортировкой
Помогите пожалуйста . Есть 2 столбца . 11111 22222 12 12 22222 ...

Сравнение двух текстов и вывод процентного совпадения
Может кто помочь написать программу? Нужно сравнить два текста и выдать сколько процентов содержимого совпадает. Сравнивать надо сразу...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
9
Ответ Создать тему
Новые блоги и статьи
Access
VikBal 11.12.2025
Помогите пожалуйста !! Как объединить 2 одинаковые БД Access с разными данными.
Новый ноутбук
volvo 07.12.2025
Всем привет. По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне: Ryzen 5 7533HS 64 Gb DDR5 1Tb NVMe 16" Full HD Display Win11 Pro
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
Поиск "дружественных имён" СОМ портов
Argus19 22.11.2025
Поиск "дружественных имён" СОМ портов На странице: https:/ / norseev. ru/ 2018/ 01/ 04/ comportlist_windows/ нашёл схожую тему. Там приведён код на С++, который показывает только имена СОМ портов, типа,. . .
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Programma_Boinc 20.11.2025
Сколько Государство потратило денег на меня, обеспечивая инсулином. Вот решила сделать интересный приблизительный подсчет, сколько государство потратило на меня денег на покупку инсулинов. . . .
Ломающие изменения в C#.NStar Alpha
Etyuhibosecyu 20.11.2025
Уже можно не только тестировать, но и пользоваться C#. NStar - писать оконные приложения, содержащие надписи, кнопки, текстовые поля и даже изображения, например, моя игра "Три в ряд" написана на этом. . .
Мысли в слух
kumehtar 18.11.2025
Кстати, совсем недавно имел разговор на тему медитаций с людьми. И обнаружил, что они вообще не понимают что такое медитация и зачем она нужна. Самые базовые вещи. Для них это - когда просто люди. . .
Создание Single Page Application на фреймах
krapotkin 16.11.2025
Статья исключительно для начинающих. Подходы оригинальностью не блещут. В век Веб все очень привыкли к дизайну Single-Page-Application . Быстренько разберем подход "на фреймах". Мы делаем одну. . .
Фото: Daniel Greenwood
kumehtar 13.11.2025
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2025, CyberForum.ru