|
0 / 0 / 0
Регистрация: 19.01.2017
Сообщений: 6
|
|
Корреляция данных20.01.2017, 21:08. Показов 1375. Ответов 19
Метки статистика (Все метки)
Доброго времени суток. У меня есть одна проблема. Мне нужно обработать некоторые статистические данные для моей магистрской работы, но проблема в том, что у меня никогда не было курса статистике, а я даже в обычной математике - профан. Буду весьма и весьма благодарен, если кто-нибудь хотя бы подскажет мне или направит мои мысли в нужном направлении.
Просто, чтобы было понятно, вкратце расскажу суть. Я занимаюсь птицами (орнитолог) У меня есть 2 типа данных: дата, в которую была поймана птица и полнота ее линьки (не важно, это просто цифра). Данные есть для каждого года за два периода: весна - начало лета и конец лета - осень. Во-первых, мне нужно узнать, как коррелируют между собой дата и полнота линьки в период конец лета. На графике линия тренда показывает, что чем дальше по дате, тем полнота линьки меньше, но мне нужно узнать достоверность этого. Во-вторых, мне нужно узнать, как влияет полнота линьки на выживаемость птиц зимой. По-умолчанию считается, что чем выше показатель полноты, тем больше шанс у птицы выжить зимой, но мне нудо это статистически доказать. На графике за период весна-лето действительно видно, что за зиму выпадают птицы с низкой полнотой и процент птиц с высоким этим показателем увеличивается относительно периода лето-осень. Но я не совсем понимаю, как мне это сделать. Распределение данным по полноте линьки по всем годам показано на рисунке [del] Это ведь не нормальное распределение данных?
0
|
|
| 20.01.2017, 21:08 | |
|
Ответы с готовыми решениями:
19
корреляция Корреляция разно-распределенных величин Корреляция функций с нулевой стандартной девиацией |
|
1965 / 1073 / 163
Регистрация: 06.12.2012
Сообщений: 4,695
|
||||
| 21.01.2017, 02:40 | ||||
|
0
|
||||
|
21 / 21 / 4
Регистрация: 18.01.2017
Сообщений: 80
|
|
| 21.01.2017, 10:33 | |
|
Доброе утро! Я почти не разбираюсь в статистике, но на мой взгляд данный график говорит максимум о том что большинство птиц к осени линяют больше чем наполовину.
Очень много суммирующихся погрешностей:1) Не указана погрешность в определении степени полноты линьки, но она не может быть меньше чем 0.05. 2) Не указана погрешность в дате измерений, но учитывая как мало поймали птиц она врятли мала. 3) Маленькое число наблюдаемых птиц уже даёт погрешность порядка 10 птиц в половине столбцов. 4) Не может ли быть что чаще ловили птиц уже полинявших, т. к. они проявляли большую активность? И при такой высокой погрешности график слишком похож на нормальное, ограниченное справа распределение. Для меня это сигнал о том что данные скорее всего грубо подгоняли. Я бы попробовал поискать другие исследования. Если других, более достоверных исследований нет, то нагнал бы формул, воды, сравнений с другими видами птиц, и прочей мути (для этого хорошо цитировать статью - источник экспериментальных данных) чтобы скрыть недочёты эксперимента. Это возможно. Кстати, как из графиков показывающих степень линьки в разное время видна зависимость выживаемости птиц от степени линьки? А то в моей голове получается логика в стиле "осенью большинство российских детей школьного возраста идут в школу, значит выживаемость детей за зиму повышается от посещения школы", и я теряюсь. ![]() Добавлено через 2 часа 6 минут Уточню, погрешности конечно не складываются, например влияние погрешности определения времени измерения зависит от скорости линьки. Но учесть различные виды погрешностей всё равно нужно. Это кроме того что погрешность возникающая из-за того что птиц намеряли мало уже очень велика. Кроме того непонятно что понимается под столбцом над цифрой 1 - участок (0.95 - 1), или число полностью полинявших птиц. Если этот критерий не определён, то последний столбец может оказаться бесполезным для расчётов. Извините если мои комментарии окажутся совсем тупыми - не орнитолог я, и лишь пытался показать как бы я воспринимал похожий график в статье по физике.
0
|
|
|
0 / 0 / 0
Регистрация: 19.01.2017
Сообщений: 6
|
|||||||
| 22.01.2017, 19:29 [ТС] | |||||||
|
2) В каком смысле? Насколько верны даты поимки? Тут я в ведомостях ни разу ошибки не встречал. 3) Ну, это может быть. Но тут, как я сказал, человеческий фактор все решает. К сожалению, после того, как кольцеватель внем в ведомость данные, првоерить их уже никак нельзя. 4) Это не имеет значения. У меня в работе только взрослые птицы, которые уже закончили свою линьку. Линяющие птицы не учитываются. Поэтому я и спросил, какое это распределение, ибо оно всегда будет смещено вправо, а нормальное распределение Гаусса, как мне казалось, должно иметь большинство значений в центре. Но я не статистик, поэтому и спрашиваю ) Прикрепил к сообщению скрин графика. На нем четко видно, что 2008 осенью присутствует существенный процент птиц с полнотой 0,4-0,7, а весной 2009 их процент существенно уменьшается. Зато процентное соотношение птиц с 0,8 и 0,9 увеличивается по отношению к весне. И так повторяется из года в год. Всегда птицы с низкой полнотой уменшаются в количестве интенсивнее, чем птицы с высокой. Да, это не одни и те же птицы. Вон весной появились полностью перелинявшие, которых не было осенью (зимой они не линяют). Но статистика, как говорится, не врет. Из года в год картина плюс-минус такая же.
0
|
|||||||
|
21 / 21 / 4
Регистрация: 18.01.2017
Сообщений: 80
|
|
| 22.01.2017, 21:20 | |
|
Прошу прощения, я не знал что полнота линьки не меняется в течении зимы, если так, то погрешность в дате измерения роли не играет. Также, из того что птицы не линяют зимой, я сразу понял как определяется корреляцию полноты линьки с выживаемостью. Ещё снимаю обвинение в подгонке, две показанных вами гистограммы не настолько близки к нормальному распределению как первая, возможно для иллюстрации вы просто выбрали самую "красивую" из гистограмм. Но если бы большинство гистограмм было бы похоже на первую, то это было бы крайне подозрительно. Если бы я имел одну гистограмму похожую на гистограмму в вашем первом сообщении, то в своей статье (я теорфизик) этими данными не пользовался бы.
Если в изначальных данных полнота линьки определялась как 0.7, 0.8, и т. п. , то скорее всего погрешность измерения полноты линьки равна +- 0.05, разве не так? А нельзя ли просто предположить что полнота линьки от года к году меняется не очень сильно, сложить для большей точности результаты для разных лет, и сразу построить функцию процента выживания (с точностью да коэффициента) в зависимости от полноты линьки (на интервале где измерений много). Ведь если осенью распределение f(полноты линьки), то весной она будет {нормировочная константа}*{Процент выживших}(Полноты линьки)*f(полноты линьки). Или у меня заскок и так сделать не получится? А оценив функцию процента выживания (с точностью да коэффициента) в зависимости от полноты линьки можно поискать и точность такой оценки (она будет очень мала). Кстати, нормировочную константу тоже легко определить если известен общий процент переживших зиму птиц.
0
|
|
|
1965 / 1073 / 163
Регистрация: 06.12.2012
Сообщений: 4,695
|
|
| 23.01.2017, 00:49 | |
|
А вы проверяли гипотезу о нормальности распределения?
0
|
|
|
21 / 21 / 4
Регистрация: 18.01.2017
Сообщений: 80
|
|||
| 23.01.2017, 02:22 | |||
|
Уточню про влияние на выживаемость. Раз есть многолетние наблюдения, значит число измерений в разы больше, и точность измерений уже не так мала. Если различие в выживаемости для полноты линьки 0.6 и для 0.9 больше 10%, то скорее всего это можно определить с не слишком маленькой доверительной вероятностью. И раз ищется ищется различие в проценте выживаемости для различной полноты линьки, то проще (как мне кажется) построить этот график для всех лет в совокупности, найти точность (как точность отношения числа измеренных весной и осенью птиц с данной полнотой линькт) с малой доверительной вероятностью (например процентов 80) и сравнить выживаемость для 0.6 и 0.9. Если отрезки вероятных значений для полноты линьки 0.6 и 0.9 не имеют пересечения, то можно сказать (с вероятностью 80%) что птицы с большей полнотой линьки выживают лучше. Если нет, то нет, и я не знаю как повысить точность из тех же данных.
![]()
0
|
|||
|
0 / 0 / 0
Регистрация: 19.01.2017
Сообщений: 6
|
|||||||
| 24.01.2017, 03:06 [ТС] | |||||||
|
И я не совсем понимаю эту формулу (тройка по вышке запорола мне красный диплом в бакалавриате). Как можно выразить распределение по полноте осенью (диапазон значений) через одну f?
0
|
|||||||
|
21 / 21 / 4
Регистрация: 18.01.2017
Сообщений: 80
|
|||
| 24.01.2017, 04:48 | |||
|
И нам не важно тех же или других птиц мы поймали. У нас есть распределение (измеренное с какой-то точностью) птиц до зимы и после зимы, раз птицы зимой не линяют, то это даёт нам отношение выживаемостей птиц с разной степенью полноты линьки. Если бы мы знали среднюю вероятность птицы пережить зиму без учёта степени полноты линьки, то могли бы оценить вероятность пережить зиму с известной степенью полноты линьки. Проиллюстрирую для понятности: пусть до пьянки у нас было в три раза больше бутылок пива чем бутылок водки, а после пьянки осталось в два раза больше бутылок водки чем бутылок пива. Из этой информации мы не можем сказать какой процент бутылок пива пережил пьянку, но можем сказать что шансы пережить пьянку у бутылки пива были в шесть раз меньше чем у бутылки водки. Так понятнее?
0
|
|||
|
1965 / 1073 / 163
Регистрация: 06.12.2012
Сообщений: 4,695
|
|
| 24.01.2017, 07:59 | |
|
Коэффициент корреляции между у и х показывает степень линейной связи у от х.
0
|
|
|
21 / 21 / 4
Регистрация: 18.01.2017
Сообщений: 80
|
||
| 24.01.2017, 09:13 | ||
|
0
|
||
|
0 / 0 / 0
Регистрация: 19.01.2017
Сообщений: 6
|
|||||
| 24.01.2017, 23:36 [ТС] | |||||
|
Только я могу запутаться в расчетах. Вот, предположим, у нас осенью есть 1000 птиц с полнотой 0,6 и 1500 птиц с полнотой 0,9, а после зимы их стало 200 и 1000 соответственно. От первых убыло 800, от вторых 500. То есть, за сезон 0,6 теряют на 47% больше, ведь так? То есть, сюда нужно добавить обычную вероятность смерти птицы, не связанную с линькой?
0
|
|||||
|
21 / 21 / 4
Регистрация: 18.01.2017
Сообщений: 80
|
|||
| 25.01.2017, 01:13 | |||
|
1
|
|||
|
1965 / 1073 / 163
Регистрация: 06.12.2012
Сообщений: 4,695
|
||
| 25.01.2017, 01:56 | ||
|
1000=k(0.9)*k*1500 k - естественная убыль, k(0.9), k(0.6) - убыль, связанная с линькой.
0
|
||
|
21 / 21 / 4
Регистрация: 18.01.2017
Сообщений: 80
|
||
| 25.01.2017, 02:22 | ||
|
200=f(0.6)*1000 * некоторая константа 1000=f(0.9)*1500 * та же константа, следовательно f(0.6)/f(0.9) = 3/10 Добавлено через 8 минут Эта константа связана с тем что мы наблюдаем осенью не тех же птиц что зимой; вроде бы она равна средней выживаемости зябликов за зиму умноженной на отношение общего числа измеренных птиц осенью к общему числу измеренных птиц зимой. Хотя в данном случае величина этой константы нас не интересует, тем более что определить мы её не можем. Добавлено через 4 минуты * То есть не измеренных птиц зимой, а измеренных (или наблюдаемых?) птиц весной, конечно.
0
|
||
|
0 / 0 / 0
Регистрация: 19.01.2017
Сообщений: 6
|
|||||
| 26.01.2017, 01:36 [ТС] | |||||
|
0
|
|||||
|
1965 / 1073 / 163
Регистрация: 06.12.2012
Сообщений: 4,695
|
||
| 26.01.2017, 02:11 | ||
|
Также следует проверить гипотезу о значимости коэффициента корреляции. А на графике выведите показания коэффициента детерминации.
0
|
||
|
21 / 21 / 4
Регистрация: 18.01.2017
Сообщений: 80
|
||
| 26.01.2017, 03:22 | ||
Оценивал так: решил что диапазон для доверительной вероятности 80% порядка 1.3 среднего квадратичного отклонения (раз для 1 ср. кв. отклонения шетьдесят с чем-то процентов доверительная вероятность), а среднее квадратичное отклонение (для каждого можителя и делителя) порядка корня из величины. Сложил относительные отклонения (единица разделить на корень из n) для множителей и делителей (всего четырёх) и помножил 1.3. Получил чуть больше 20%. Но это не претендуя на истину, а лишь для того чтобы понять порядок случайной ошибки. Конечно, мне лучше было бы напомнить учебник, посмотреть таблицу (или проинтегрировать на компе нормальное распределение самому), и сказать надёжно.
0
|
||
|
0 / 0 / 0
Регистрация: 19.01.2017
Сообщений: 6
|
|||||
| 27.01.2017, 06:41 [ТС] | |||||
|
0
|
|||||
|
21 / 21 / 4
Регистрация: 18.01.2017
Сообщений: 80
|
||
| 27.01.2017, 07:15 | ||
|
0
|
||
| 27.01.2017, 07:15 | |
|
Помогаю со студенческими работами здесь
20
Корреляция Корреляция Корреляция и автокорреляция Свертка и корреляция Корреляция в Python Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
|||
|
SDL3 для Web (WebAssembly): Реализация движения на Box2D v3 - трение и коллизии с повёрнутыми стенами
8Observer8 20.02.2026
Содержание блога
Box2D позволяет легко создать главного героя, который не проходит сквозь стены и перемещается с заданным трением о препятствия, которые можно располагать под углом, как верхнее. . .
|
Конвертировать закладки radiotray-ng в m3u-плейлист
damix 19.02.2026
Это можно сделать скриптом для PowerShell. Использование
. \СonvertRadiotrayToM3U. ps1 <path_to_bookmarks. json>
Рядом с файлом bookmarks. json появится файл bookmarks. m3u с результатом.
# Check if. . .
|
Семь CDC на одном интерфейсе: 5 U[S]ARTов, 1 CAN и 1 SSI
Eddy_Em 18.02.2026
Постепенно допиливаю свою "многоинтерфейсную плату". Выглядит вот так:
https:/ / www. cyberforum. ru/ blog_attachment. php?attachmentid=11617&stc=1&d=1771445347
Основана на STM32F303RBT6.
На борту пять. . .
|
Камера Toupcam IUA500KMA
Eddy_Em 12.02.2026
Т. к. у всяких "хикроботов" слишком уж мелкий пиксель, для подсмотра в ESPriF они вообще плохо годятся: уже 14 величину можно рассмотреть еле-еле лишь на экспозициях под 3 секунды (а то и больше),. . .
|
|
И ясному Солнцу
zbw 12.02.2026
И ясному Солнцу,
и светлой Луне.
В мире
покоя нет
и люди
не могут жить в тишине.
А жить им немного лет.
|
«Знание-Сила»
zbw 12.02.2026
«Знание-Сила»
«Время-Деньги»
«Деньги -Пуля»
|
SDL3 для Web (WebAssembly): Подключение Box2D v3, физика и отрисовка коллайдеров
8Observer8 12.02.2026
Содержание блога
Box2D - это библиотека для 2D физики для анимаций и игр. С её помощью можно определять были ли коллизии между конкретными объектами и вызывать обработчики событий столкновения. . . .
|
SDL3 для Web (WebAssembly): Загрузка PNG с прозрачным фоном с помощью SDL_LoadPNG (без SDL3_image)
8Observer8 11.02.2026
Содержание блога
Библиотека SDL3 содержит встроенные инструменты для базовой работы с изображениями - без использования библиотеки SDL3_image. Пошагово создадим проект для загрузки изображения. . .
|