Форум программистов, компьютерный форум, киберфорум
Статистика, теория вероятностей
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
0 / 0 / 0
Регистрация: 22.07.2020
Сообщений: 1

Оптимизация объема выборки с применением методики бутстреп

22.07.2020, 13:14. Показов 487. Ответов 1
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
ЗДравствуйте!

Подскажите, пожалуйста, как проводится оптимизация выборки при помощи бутстреп. Многочисленные материалы из интернета никакой ясности не дают. Мне уже удалось (кажется) получить какие-то данные в стат. программе по бутсреп, а как их интерпретировать и использовать - не понятно.
0
IT_Exp
Эксперт
34794 / 4073 / 2104
Регистрация: 17.06.2006
Сообщений: 32,602
Блог
22.07.2020, 13:14
Ответы с готовыми решениями:

Оптимизация выборки из List большого объема
Всем добрый день! У меня есть список координат, где хранятся больше 100к записей. Я прохожу этот список двойным циклом для нахождения...

Определение оптимального объёма выборки
Воброс частично из области агрономии. Есть таблица с данными. Строки таблицы представляют собой образцы семян. В колонках описано как...

Определение минимального объёма выборки для исследования
Подскажите, пожалуйста, как быть. В статистике совсем недавно. Ситуация следующая: Генетика. Есть две выборки: пациенты и контроль. И...

1
524 / 512 / 129
Регистрация: 31.10.2016
Сообщений: 4,156
09.08.2020, 15:24
Бутстреп - это "размножение" выборки. Бутстрепированная псевдовыборка составляется из случайно отобранных наблюдений исходной выборки. Отбор производится с повтором, т.е. однажды выбранное наблюдение исходной выборки из неё не удаляется, и может быть выбрано повторно. Для отбора используется генератор случайных чисел в диапазоне от 1 до N (N - объём исходной выборки). В итоге, некоторые наблюдения попадают в псевдовыборку несколько раз, а некоторые - не попадают ни разу. Размер псевдовыборки может быть произвольным.

Основная идея в том, что в силу случайной генерации, различия законов распределения оригинальной и псевдовыборок носят случайный характер. Соответственно, оценки любых статистик, вычисленные по псевдовыборкам, случайным образом отличаются от их истинных значений. Причём считается, что эмпирический закон распределения бутстреп-оценок приближается к их истинному закону распределения в генеральной совокупности.

Таким образом, дополнительно к оценкам, полученным по оригинальной выборке, бутстреп позволяет получить множество бутстрепированных оценок, по которым можно построить закон распределения, найти доверительные интервалы и даже устранить выборочное смещение.

Корректность подобных манипуляций основывается на предположении, что генерируемые псевдовыборки статистически независимы. В действительности это предположение не выполняется, так как все псевдовыборки состоят из одних и тех же наблюдений. Тем не менее, считается, что это можно не принимать во внимание.

Практически, бутстреп целесообразно применять только в тех случаях, когда не существует теоретических оценок доверительных интервалов для вычисляемой статистики, или - когда нарушены предпосылки для их вычисления. В таких случаях - это лучше чем ничего.
Например - классические оценки доверительных интервалов корреляции Пирсона корректны лишь в случае нормального закона совместного распределения сравниваемых величин. Если эта предпосылка нарушена - то бутстрепированные доверительные интервалы могут оказаться лучше теоретических. Если же эта предпосылка строго выполняется - бутстрепированные доверительные интервалы, наоборот, будут менее точными.
2
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
BasicMan
Эксперт
29316 / 5623 / 2384
Регистрация: 17.02.2009
Сообщений: 30,364
Блог
09.08.2020, 15:24
Помогаю со студенческими работами здесь

оптимизация выборки
есть несколько таблиц и текст который проверяет каждое слово к какой таблице относится, я делаю проверку примерно так ...

Расчёт необходимого объёма выборки для построения матрицы планирования эксперимента
Всем привет! Есть таблица сопоставляющая химические свойства стали механическим. То есть, в каждой из строк указывается содержание в...

Оптимизация запросов выборки
/components/content/frontend.php => getArticlesCount() SELECT 1 FROM cms_content con INNER JOIN cms_category cat ON cat.id =...

Оптимизация выборки из списка
Всем доброе время суток! У меня есть список LIST, где хранятся значения координат. Также у меня есть участок, например 2000м на 2000м,...

Оптимизация количества частот применением поляризации (Wimax)
Всем добрый день. Подскажите как оптимизировать количество частот с помощью поляризации при частотно-территориальном планировании. План...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
2
Ответ Создать тему
Новые блоги и статьи
Отправка уведомления на почту при изменении наименования справочника
Maks 24.03.2026
Программная отправка письма электронной почты на примере изменения наименования типового справочника "Склады" в конфигурации БП3. Перед реализацией необходимо выполнить настройку системной учетной. . .
модель ЗдравоСохранения 5. Меньше увольнений- больше дохода!
anaschu 24.03.2026
Теперь система здравосохранения уменьшает количество увольнений. 9TO2GP2bpX4 a42b81fb172ffc12ca589c7898261ccb/ https:/ / rutube. ru/ video/ a42b81fb172ffc12ca589c7898261ccb/ Слева синяя линия -. . .
Midnight Chicago Blues
kumehtar 24.03.2026
Такой Midnight Chicago Blues, знаешь?. . Когда вечерние улицы становятся ночными, а ты не можешь уснуть. Ты идёшь в любимый старый бар, и бармен наливает тебе виски. Ты смотришь на пролетающие. . .
SDL3 для Desktop (MinGW): Вывод текста со шрифтом TTF с помощью библиотеки SDL3_ttf на Си и C++
8Observer8 24.03.2026
Содержание блога Финальные проекты на Си и на C++: finish-text-sdl3-c. zip finish-text-sdl3-cpp. zip
Жизнь в неопределённости
kumehtar 23.03.2026
Жизнь — это постоянное существование в неопределённости. Например, даже если у тебя есть список дел, невозможно дойти до точки, где всё окончательно завершено и больше ничего не осталось. В принципе,. . .
Модель здравоСохранения: работники работают быстрее после её введения.
anaschu 23.03.2026
geJalZw1fLo Корпорация до введения программа здравоохранения имела много невыполненных работниками заданий, после введения программы количество заданий выросло. Но на выплатах по больничным это. . .
Контроль уникальности заводского номера
Maks 23.03.2026
Алгоритм контроля уникальности заводского (или серийного) номера на примере нетипового документа выдачи шин для спецтехники с табличной частью, разработанного в конфигурации КА2. Данные берутся из. . .
Хочу заставить корпорации вкладываться в здоровье сотрудников: делаю мат модель здравосохранения
anaschu 22.03.2026
e7EYtONaj8Y Z4Tv2zpXVVo https:/ / github. com/ shumilovas/ med2. git
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru