Форум программистов, компьютерный форум, киберфорум
Наши страницы
SETI25
Войти
Регистрация
Восстановить пароль
Оценить эту запись

Проекты распределённых вычислений

Запись от SETI25 размещена 16.11.2019 в 08:07

Проекты распределённых вычислений
Folding@Home и Rosetta@Home
Общая информация о проектах: vk.com/boinc , tsc.overclockers.ru , www.boinc.ru , distributed.org.ua и distributed.ru

Подключайте Ваши компьютеры к проектам распределённых вычислений! Этим Вы окажете большую помощь в развитии математики, медицины и других наук, при этом это никак не скажется на скорости работы Ваших компьютеров, так как проекты работают на приоритете IDLE (то есть счёт ведётся только тогда, когда другие службы и программы не используют Ваш процессор)
Краткий обзор проектов
Проект Folding@Home - исследование фолдинга белков (то есть их "сворачивания" в уникальную пространственную структуру, определяющую функции белка), преимущественно в аспекте борьбы с некоторыми заболеваниями, порождёнными нарушениями их функций (например, болезнь Альцгеймера, отдельные виды рака, "коровье бешенство" и др.). Исследование осуществляется путём компьютерного моделирования процесса фолдинга ("сворачивания") белков на машинах добровольцев. Клиентское ПО забирает с одного из многочисленных серверов Folding@Home данные о белках и проводит на компьютере пользователя моделирование фолдинга (от нескольких часов до нескольких суток и более) и отправляет результаты обратно на сервер.
Проект Rosetta@Home - вычисление трехмерной структуры белков из их аминокислотных последовательностей. Это одна из самых больших проблем в молекулярной биологии. Одно из самых важных открытий в молекулярной биологии - то, что в пространстве белковая структура (связка аминокислот) стремится занять такое положение, чтобы энергия этой структуры была минимальна (представьте шар в трубе - шар будет всегда катиться вниз к основанию трубы, потому что это - самое устойчивое состояние). Итак, задача программы Rosetta@Home - посчитать наименьшую энергию белковой системы, если известны составляющие этой системы (аминокислоты) - при этой минимальной энергии это и будет искомый белок! Одна из сложностей заключается в том, что последовательностей аминокислот, из которых состоит белок много, в пространстве их можно соединить разными способами. Сочетание различных комбинаций соединений аминокислот дает огромные цифры - вот причина, по которой проекту так нужны большие вычислительные мощности.
По сути Rosetta - это компьютерная программа для поиска:
- структуры с наименьшей энергией для заданной аминокислотной последовательности для предсказания структуры белка
- обратная задача - поиск аминокислотной последовательности с наименьшей энергией для заданной белковой структуры
- расчета взаимодействия комплекса белок-белок.
Какой проект выбрать
Выбор проекта, который будет использоваться на Вашем компьютере зависит в первую очередь от вида подключения к Интернет/оплаты трафика. Проект Rosetta@Home в день потребляет до 30 мегабайт входящего трафика и 500 килобайт исходящего. А вот проект Folding@Home в среднем скачивает задание размером всего 300 килобайт, считает его несколько дней и потом столько же отдаёт и закачивает новое. Так что если у Вас безлимитный Интернет и широкий канал, то лучше выбрать проект Rosetta@Home , а иначе - Folding@Home . Также выбор во многом зависит и от количества оперативной памяти компьютера. Проект Rosetta@Home занимает до 300 мегабайт ОЗУ, а Folding@Home - занимает в памяти всего 20 мегабайт (если не включен режим получения больших заданий, при котором может требоваться около 120 мегабайт ОЗУ). И все эти цифры следует умножить на число ядер у процессора.
Также в данный момент лучше при технической возможности (большой объём ОЗУ и неограниченный трафик) подключиться к проекту Rosetta@Home , поскольку сейчас в мире для проекта Rosetta@Home остро не хватает вычислительной мощности, в то время как у Folding@Home сейчас большое число считающих компьютеров, а также приставок PS3, видеокарт и т.д.
Ещё нужно придерживаться правила, что чем быстрее процессор, тем целесообразнее на нём считать Folding@Home , а чем слабее - тем выше целесообразность счёта на нём проекта Rosetta@Home . (А если процессор очень старый, менее 1 ГГц, то тогда Folding@Home вообще не целесообразно считать на нём). В таком случае лучше считать проект Rosetta@Home (если позволяет ОЗУ и интернет-трафик), а при малых количествах ОЗУ и когда нельзя позволить большой интернет-трафик - то считать либо POEM@Home либо Spinhenge@Home (см. ниже).

Также перед выбором проекта - см. ветку форума http://forums.overclockers.ru/viewforum.php?f=21
Если Вы используете сеть "ВКонтакте", в ней группа команды распределённых вычислений следующая: http://vkontakte.ru/club186520 в ней много полезной справочной информации, можно задавать вопросы по проекту Folding@Home . По BOINC-проектам группа такая: http://vkontakte.ru/club11963359
http://my.mail.ru/community/cranch - группа о распределённых вычислениях в сети "Мой мир" на Mail.Ru.
http://my.mail.ru/community/fhclub/ - группа о проекте Folding@Home в сети "Мой мир" на Mail.Ru.
http://www.facebook.com/group.php?gid=12646995655 - группа о распределённых вычислениях в сети "Facebook".
http://minskfoldingteam.at.tut.by/ - форум в Минске.
http://vip.karelia.ru/viewtopic.php?t=51525 - форум в Петрозаводске.
distributedcomputing.info - Самая свежая информация о текущих активных проектах распределённых вычислений.

www.gridrepublic.org - Статистика и описание проектов распределённых вычислений на платформе BOINC
http://blog.karelia.ru/yura8/ - Новости про науку, образование, распределённые вычисления
http://ru.wikipedia.org/wiki/%D0%A0%...BD%D0%B8%D1%8F - статья в энциклопедии о распределённых вычислениях.
Новые интересные статьи про распределённые вычисления. Интересно прочитать всем:

1) Распределенные вычисления: волонтеры на службе науки (статья из журнала): http://www.vechnayamolodost.ru/pages...onaslnab6.html

2) Интернет-журнал «Распределенные вычисления»: самые свежие новости проектов и их результаты и достижения: http://new-distributed.livejournal.com/

3) Статья «Распределенные вычисления: домашний компьютер как научная лаборатория»: http://prostonauka.com/raspredelennye-vychislenija

Всем кому интересно - по адресу http://boinc.gorlaeus.net/FinishedProjects.php полное описание (файлы в формате PDF, PPT, XLS) уже завершённых решённых задач по классической динамике (с помощью проекта Leiden Classical . Там на нидерландском языке, но всё равно, много графиков и иллюстраций, на которые интересно посмотреть, чтобы понять ценность и важность применения распределённых вычислений для решения различных задач из различных областей физики.

Также есть сайт сравнительно новый сайт (недавно появился): http://boinc.netsoft-online.com/ где можно посмотреть различную подробную статистику по текущим BOINC проектам (и завершённым BOINC проектам)
Платформа BOINC и проект Rosetta@Home
Установка BOINC, регистрация аккаунта для проекта Rosetta@Home настолько просты, что подробно здесь описываться не будут.

Иллюстрация процесса установки программы BOINC

На сайте www.boinc.ru есть FAQ, подробная информация по установке, проекту Rosetta@Home и другим проектам. Саму программу BOINC можно загрузить с сайта http://boinc.berkeley.edu/ . Для подключения к проекту - адрес: http://boinc.bakerlab.org/rosetta

Кстати, для более надёжной работы проектов в BOINC необходимо в "Настройки клиента..." - "диск и память" - поставить галку "Оставлять неактивные приложения в памяти".
Ещё в настройках BOINC нужно в "Настройки клиента..." - "процессор" - "В многопроцессорных системах использовать" ___ % процессоров - обязательно поставить 100 % (иначе будут использоваться не все ядра процессора).
Другие, наиболее интересные проекты на платформе BOINC, которые также полезны для науки и медицины:
1) Проект LHC@Home - научно-исследовательский BOINC-проект распределенных вычислений, изучающий движение заряженных частиц в Большом Адронном Коллайдере. Присоединиться к проекту - http://lhcathomeclassic.cern.ch/sixtrack/
2) Ещё один полезный проект, к которому также можно подключиться пользователям BOINC - это RALPH@Home который занимается тестированием новых счётных модулей для проекта Rosetta@Home . Присоединиться к проекту - http://ralph.bakerlab.org/
Требования к компьютеру и Интернету у RALPH@Home точно такие же, как и у проекта Rosetta@Home , поэтому если Вы подключились к Rosetta@Home , то желательно подключиться одновременно и к RALPH@Home . Участвовать в RALPH@Home как только в одном проекте нет смысла, поскольку задания для него бывают раз в 3 или 4 недели (когда выходит новый счётный модуль).
3) Asteroids@home - проект изучает форму и параметры вращения астероидов по фотометрическим данным. Присоединиться к проекту - http://asteroidsathome.net/boinc/
4) Проект POEM@Home - в проекте используется метод моделирования структуры белка. Комбинированный подход в изучении строении белка, дальние цели этого проекта - разработать метод моделирования белковых молекул, которые уже могут использовать фармацевты, врачи, ученые, а также детально изучить структуру мебранных белков. Присоединиться к проекту - http://boinc.fzk.de/poem/

boincstats.com - просмотр статистики, состояния всех BOINC-проектов.
boincsynergy.com - просмотр статистики, новости BOINC-проектов.

http://boincstats.com/stats/project_graph.php?pr=bo - статистика BOINC проектов за последний день, месяц, и т.д.

Проект Folding@Home
установка на компьютер клиента
Здесь будет рассмотрен самый простой и распространённый случай, когда устанавливается консольный клиент в качестве службы (без задействования видеокарт ATI / NVIDIA или нескольких процессоров, для которых совсем другие клиенты).
Необходимо войти на компьютер с правами администратора (поддерживаются системы Windows 2000/XP/2003).
Далее создать каталог C:\WINDOWS\system32\FAH\ в который поместить файлы FAH504-Console.exe, client.cfg, FoldinGL.exe и дать команду:
sc create FAH type= own start= auto error= normal binPath= "C:\WINDOWS\system32\FAH\FAH504-Console.exe -svcstart" obj= LocalSystem DisplayName= FAH
Внимание, если используется версия 6.хх консольного клиента, то сам файл будет называться не FAH504-Console.exe, а Folding@home-Win32-x86.exe и в параметрах сервиса надо указывать путь к каталогу, куда он устанавливается, то есть команда для установки сервиса будет такой:

sc create FAH type= own start= auto error= normal binPath= "C:\WINDOWS\system32\FAH\Folding@home-Win32-x86.exe -svcstart -d C:\WINDOWS\system32\FAH" obj= LocalSystem DisplayName= FAH
Теперь можно открыть сервисы Windows и запустить сервис FAH (либо вообще просто дать команду sc start FAH ). И всё, клиент подключится к серверам Folding@Home - проекта, скачает задание и счётное ядро и будет считать в течении нескольких дней. Всё будет далее работать незаметно для пользователя.
Вот назначение файлов:
FAH504-Console.exe или Folding@home-Win32-x86.exe - собственно сам сервис
client.cfg - настройки клиента
FoldinGL.exe - программа для 3D просмотра обрабатываемых молекул

Сейчас конечно лучше ставить саму последнюю версию, а информация о 5.04 приведена только потому, что она была с ноября 2005 и по август 2008 повсеместно используемой и не менялась за эти 3 года, что говорит о её проверенной стабильности.
Структура файла client.cfg
[settings]
username=Colombia
team=47191
asknet=no
bigpackets=no
machineid=1
local=0

[http]
active=no
usereg=no
usepasswd=no
proxy_name=
proxy_passwd=
host=
port=

[core]
priority=0
cpuusage=99
disableassembly=no
checkpoint=15
ignoredeadlines=no

[power]
battery=no

[clienttype]
memory=480
type=0
Теперь краткое описание файла client.cfg:

username= Ваше имя, которое будет отображаться на серверах статистики
team=47191 - номер команды
bigpackets= Для 5.04 и 6.хх версий этот параметр может принимать разные значения. В версии 5.04 - no - получать из Интернет задания размером до 20 килобайт (в ОЗУ будут занимать до 10 мегабайт), yes - получать из Интернет задания размером до 3 мегабайт (в ОЗУ будут занимать до 120 мегабайт). В версиях 6.хх - small получать меньше 5 Мб, normal - получать до 10 Мб, а big - получать более 10 Мб. Реально же, если указать small, то задания пока выдаются меньше 300 килобайт.
priority=0 - ставьте priority всегда равным 0 (иначе Folding не будет вытесняться при сканировании дисков антивирусом Symantec или Kaspersky).
cpuusage=99 - ставить 100 не рекомендуется (при 100 были сообщения о проблемах с Nero).
memory=480 - сколько ОЗУ не жалко для проекта (хотя на данный момент максимум будет расходоваться 120 Мб).
Вот готовый архив для быстрого запуска: fah-client.zip - в этом архиве самая свежая консольного клиента (на данный момент - 6.23). Архив нужно распаковать в каталог C:\WINDOWS\system32\ (получится каталог C:\WINDOWS\system32\FAH\). Из него надо просто запустить 1 раз файл Run.cmd - он установит в систему сервис FAH. И всё, можно дать команду sc start FAH - и сервис запустится.
Если у Вас процессор с Hyper Threading или с несколькими ядрами, то тогда следует установить несколько копий клиента на компьютер. Второй - в папку например C:\WINDOWS\system32\FAH1\ и только не забыть в файле Run.cmd перед его запуском в 4 местах слово FAH заменить на FAH1 и в файле client.cfg вместо machineid=1 поставить machineid=2
На всякий случай - архив с предыдущей 5.04 версией клиента: old-fah-client-504.zip - эта версия уже устарела, но на всякий случай может кому и потребуется (ведь она была с ноября 2005 и по август 2008 повсеместно используемой и не менялась за эти 3 года, что говорит о её проверенной стабильности).
Ещё одна важная причина, по которой на странице до сих пор выложена версия 5.04, - это то, что было замечено, что новые версии клиента (6.20, 6.23 и т.д.) при ВСЕХ значениях параметра bigpackets= выдают задания случайных размеров, когда большие, когда маленькие. Так что на компьютерах с малым количеством ОЗУ и где платный интернет до сих пор актуальна версия клиента 5.04, так как при значении bigpackets=no она точно выдаёт короткие задания (до 300 килобайт), которые требуют мало ОЗУ.

Внимание! Концы строк в файле client.cfg должны быть только символом $0A (если Ваш редактор сделает $0D$0A, то при запуске программы файл client.cfg не только не будет прочитан, но и всё его содержимое будет стёрто). Используйте для редактирования client.cfg только FAR Manager (после редактирования - проверьте, какие концы строк). Чтобы принудительно сделать концы строк $0A следует использовать плагин trucr104 для FAR ( ftp://info.elf.stuba.sk/pub/pc/utilfile/trucr104.rar ).
Программа FoldinGL.exe - программа для 3D просмотра обрабатываемых молекул, однако она может работать не на всех видеокартах.
FoldinGL НЕ работает на Intel 810 и ниже, RAGE XL PCI Family (если драйвера встроенные в Windows), SiS 661FX и ниже
FoldinGL работает на Intel 815 (если драйвера от Intel) и выше, NVidia Vanta LT и выше, S3 Graphics ProSavageDDR
Также в случае если задание для нового ядра FahCore_7c.exe то программа FoldinGL зависает.
http://fah-web.stanford.edu/cgi-bin/main.py?qtype=osstats - быстрый просмотр статистики по Folding@Home (сколько компьютеров, процессоров занято для проекта во всём мире).
Выбор проектов в случае многоядерных процессоров
Если у Вас достаточно мощный современный компьютер с двуядерным процессором (или технологией Hyper Threading) или несколько процессоров, всегда надо помнить, что клиент Folding@Home использует только одно ЯДРО. GPU клиент Folding@Home в случае видеокарты ATI также использует только одно ядро центрального процессора. А вот видеокарты NVidia вообще не используют центральный процессор при расчётах.
Исключение составляет лишь SMP клиент для Folding@Home , который специально предназначен для многоядерных систем и использует все ядра.
Предположим, такой случай. У Вас четырёхядерный процессор и современная видеокарта ATI. Тогда самый лучший выбор будет такой - поставить один GPU клиент и один SMP клиент (не забывать, конечно с разными machineid в настройках client.cfg). Причём для SMP клиента сделать доступ не ко всем 4, а только к 3 ядрам. Тогда одно ядро будет для GPU клиента. В этом случае у компьютера будут для расчётов задействованы все ядра процессора + видеокарта и будет достигнута максимальная вычислительная мощь. А случае видеокарты NVidia, в SMP клиенте даже не надо закрывать доступ к одному ядру (т.к. в случае видеокарт NVidia центральный процессор не используется вообще).

Выбор проектов для современных
видеокарт ATI и NVidia
Если у компьютера имеется современная видеокарта ATI (24xx и выше) или NVidia (GeForce 8ххх и выше), то тогда имеет смысл задействовать её для распределённых вычислений. Причём следует учитывать, что видеокарта ATI при расчётах целиком использует одно ядро центрального процессора. А вот видеокарты NVidia вообще не используют центральный процессор при расчётах. Таким образом, например, если у Вас двуядерный процессор и современная видеокарта NVidia, то можно использовать на компьютере не 2, а 3 клиента Folding@Home (два - консольных однопроцессорных и один - графический)!!!

Работают сразу 3 клиента на двуядерном процессоре!

Кстати, в случае если у Вашего компьютера видеокарта от NVidia, большой объём ОЗУ и безлимитный интернет (и к тому же компьютер долго не выключается), то в таком случае лучше всего центральный процессор целиком отдать проекту Rosetta@Home , а видеокарту NVidia отдать проекту GPUGRID (который тоже потребляет большой интернет трафик). Основная направленность проекта GPUGRID - моделирование молекул.
________________________________________
Некоторые картинки, иллюстрации:

Как надо правильно устанавливать BOINC в Windows,
чтобы он запускался без участия пользователя в качестве службы.
Однако, если Вы будете участвовать в проектах, которые используют видеокарту, то тогда эту галку устанавливать нельзя, иначе BOINC не будет видеть видеокарту!

Иллюстрация процесса установки программы BOINC

Иллюстрации по проекту Folding@Home :
1) Одна из обрабатываемых молекул (ядро Gromacs - FahCore_78.exe) (получен программой FoldinGL) при bigpackets=no
2) Одна из обрабатываемых молекул (ядро Gromacs - FahCore_78.exe) (получен программой FoldinGL) при bigpackets=yes
3) Одна из обрабатываемых молекул (ядро Gromacs - FahCore_78.exe) (получен программой FoldinGL) при bigpackets=yes
4) Одна из обрабатываемых молекул (ядро Gromacs - FahCore_78.exe) (получен программой FoldinGL) при bigpackets=yes
5) Одна из обрабатываемых молекул (ядро Gromacs 33 - FahCore_a0.exe) (получен программой FoldinGL) при bigpackets=yes
В файле projects_sep_okt_2009.xls представлены данные за 2 месяца (сентябрь и октябрь 2009 года) про продвижение проекта Rosetta@Home , а также в этом файле находятся 26 листов, на которых представлены данные о продвижении и состоянии 15 самых активных проектов за соответствующий день (по данным сайта http://boincstats.com/).
Размещено в Без категории
Просмотров 163 Комментарии 2
Всего комментариев 2
Комментарии
  1. Старый комментарий
    Аватар для Vourhey
    Это уже на спам похоже. Хватит об одном и том же писать. Смени пластинку.
    Запись от Vourhey размещена 16.11.2019 в 17:19 Vourhey вне форума
  2. Старый комментарий
    У товарища просто печалька - что бесплатные рабы массово кончились в связи с появлением у них возможностей помайнить разнообразную крипту (т.е. получить хоть какую-то денежку за потраченную компом энергию - может быть, даже в итоговый финансовый плюс).
    Вот и спамит он по площадям (он на Хоботе тоже старую тему поднял - но я в неё не заходил и не знаю, насколько он там активен в завлекании буратин. Но если и туды, и сюды одинаковое - то да, чисто спам).
    Запись от VTsaregorodtsev размещена 16.11.2019 в 18:00 VTsaregorodtsev вне форума
 
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin® Version 3.8.9
Copyright ©2000 - 2019, vBulletin Solutions, Inc.