Форум программистов, компьютерный форум, киберфорум
Python: Научные вычисления
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 5.00/6: Рейтинг темы: голосов - 6, средняя оценка - 5.00
 Аватар для 777lux
0 / 0 / 0
Регистрация: 21.05.2013
Сообщений: 24

Data Science и Python

18.12.2017, 22:24. Показов 1215. Ответов 2
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Здравствуйте. Хочу перепрофилироваться в направлении Data Science.... интересует вопрос какую часть в работе занимают сугубо математические расчеты,которые нужно было учить на таких академических специальностях как прикладная математика, инженерия и т.д. Спасибо. И прошу давать вменяемые советы.
0
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
18.12.2017, 22:24
Ответы с готовыми решениями:

Web или Data Science - где легче вход?
Здравствуйте, Освоил Python на таком уровне, что далее нужно уже выбирать профессиональную область для изучения и дальнейшего...

Data store in Python
Разработать базу данных или хранилище данных, работающую в интерактивном режиме и предусмотреть следующие команды: 1) add <key> -...

Нидерланды, Амстердам: Developer for Data Science team (Node.js, Python, SQL)
- BI DEVELOPER IN DATA SCIENCE – BUSINESS INTELLIGENCE CENTRE PVH EUROPE INTRODUCTION PVH is one of the largest apparel companies in...

2
Эксперт по компьютерным сетям
 Аватар для Jabbson
5907 / 3359 / 1036
Регистрация: 03.11.2009
Сообщений: 10,008
18.12.2017, 23:22
ИМХО
Если собираетесь заниматься всерьез, то для начала было бы неплохо ознакомиться с получить базовый объем знаний в статистике, методах машинного обучения, многомерном анализе и линейной алгебре, методах обработки и визуализации данных... Ну и, конечно, инструмент реализации, - R или Python.

Добавлено через 2 минуты
Но нужно ответить, что если начнете бросаться на все подряд - не выучите ничего, поэтому советую поговорить с практикующим дата-саентистом, а также проанализировать требования и рабочие обязанности вакансий с разных сайтов по поиску работы, обычно там написано, что именно нужно.
1
110 / 36 / 5
Регистрация: 27.12.2012
Сообщений: 130
19.12.2017, 11:57
777lux, зависит от позиции. Сейчас модно называть многое Data Science, но частеннько это простое программирование и аналитика. Если реально говорить о Data Science, то много. И даже дело не во времени, а в том, что это база без которой никак и ты уже не Data Scientist.

Мое ИМХО, вам желательно знать:
1) Статистика:
--- базовые знания (доверительные интервалы, тесты, максимум правдоподобия, метод моментов, работа с недостающими или неверными данными т.е. чистка базы., и т.д.)
--- сокращение размерности данных (метод главных компонент и т.п. Если есть возможность обзавестись книгой Exploratory Multivariate Data Analysis by Example Using R, F. Husson, S. Lê & J. Pagès, 2017 (2nd edition) Авторы очень хорошо объясняют на примерах.
--- методы классификации, не только базовые (kmean, EM, logit, HCPC, нейроные сети и тп, но и продвинутые SVM/kernel trick).
--- регрессии (тут все очень зависит от работы, моделей много и в разных сферах применяются по разному, зависит так же от типа данных)
2) Математика
--- Алгебра
--- Векторная геометрия, матрицы
--- Ну и все базовые знания 1-2 курса, могут всегда пригодиться.
3) Оптимизация
--- Современные алгоритмы поиска максимума/минимума, их эффективность (речь не о программировании). Например самый известный метод Ньютотна, но он адски долго будет искать оптимум в сложных ситуациях... если вообще найдет.
--- Уметь внедрять эти алгоритмы на R/Python
4) Разнообразные графики:
--- Базовые
--- Boxplot
--- Histogramme
--- Kernel
--- Correlation matrix
--- Correlogram (time series)
5) Возможно что-то специфическое из инженерии, в зависимости от фирмы и ваших задач. У меня коллеги например модделируют теплопотерии в зданиях или хорошо разбираются в электрических сетях.

Можете начать с этой лекции на Coursera и с Титаника на kaggle.

Еще важный момент, и тут я согласна с Jabbson, важно не распылятся. Базовые понятия, что я перечислила выше, знать нужно. Но углубленно нужно учить 1-3 вещи, полезные для вашей специализации. Т.е. вначале определиться где вы хотите работать и что делать. Посмотрите темы на kaggle с решеными соревнованиями, может помочь определится.

П.с. некоторые термины на популярных сайтах Data Science - больше сленг программистов. Например features - математики и статистики так не говорят.
2
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
19.12.2017, 11:57
Помогаю со студенческими работами здесь

Из аналитика в Data Science разработчика
Всем привет! Прошу совета от людей, знающих python и разбирающихся в машинном обучении. На сегодняшний день: работаю аналитиком...

Первак с мечтой Data Science
ребят подскажите пожалуйста , можно ли работать после первого курса в IT компании , на летний период , чтобы получить опыт работы на...

Data Science и Аналитик данных
Добрый день. Нужна помощь в выборе курсов (образования) в области Data Science или Аналитик данных. Какие проверенные варианты...

Data Science начинается с Deep Learning?
Приветствую. Начинаю постигать путь к Data Scince. Пока выстраиваю программу обучения для себя, так как в спец курсы идти возможности...

Задача по статистике для data science - статистика, гипотеза, интервал, нормальное разпределение, т-распределение
Народ, помогите чайнику, плз, я уже плыву совсем :( Компания теряет по 20 часов в год на каждого работника ( опoздания ). ...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
3
Ответ Создать тему
Новые блоги и статьи
Символьное дифференцирование
igorrr37 13.02.2026
/ * Логарифм записывается как: (x-2)log(x^2+2) - означает логарифм (x^2+2) по основанию (x-2). Унарный минус обозначается как ! */ #include <iostream> #include <stack> #include <cctype>. . .
Камера Toupcam IUA500KMA
Eddy_Em 12.02.2026
Т. к. у всяких "хикроботов" слишком уж мелкий пиксель, для подсмотра в ESPriF они вообще плохо годятся: уже 14 величину можно рассмотреть еле-еле лишь на экспозициях под 3 секунды (а то и больше),. . .
И ясному Солнцу
zbw 12.02.2026
И ясному Солнцу, и светлой Луне. В мире покоя нет и люди не могут жить в тишине. А жить им немного лет.
«Знание-Сила»
zbw 12.02.2026
«Знание-Сила» «Время-Деньги» «Деньги -Пуля»
SDL3 для Web (WebAssembly): Подключение Box2D v3, физика и отрисовка коллайдеров
8Observer8 12.02.2026
Содержание блога Box2D - это библиотека для 2D физики для анимаций и игр. С её помощью можно определять были ли коллизии между конкретными объектами и вызывать обработчики событий столкновения. . . .
SDL3 для Web (WebAssembly): Загрузка PNG с прозрачным фоном с помощью SDL_LoadPNG (без SDL3_image)
8Observer8 11.02.2026
Содержание блога Библиотека SDL3 содержит встроенные инструменты для базовой работы с изображениями - без использования библиотеки SDL3_image. Пошагово создадим проект для загрузки изображения. . .
SDL3 для Web (WebAssembly): Загрузка PNG с прозрачным фоном с помощью SDL3_image
8Observer8 10.02.2026
Содержание блога Библиотека SDL3_image содержит инструменты для расширенной работы с изображениями. Пошагово создадим проект для загрузки изображения формата PNG с альфа-каналом (с прозрачным. . .
Установка Qt-версии Lazarus IDE в Debian Trixie Xfce
volvo 10.02.2026
В общем, достали меня глюки IDE Лазаруса, собранной с использованием набора виджетов Gtk2 (конкретно: если набирать текст в редакторе и вызвать подсказку через Ctrl+Space, то после закрытия окошка. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru