|
0 / 0 / 0
Регистрация: 21.05.2013
Сообщений: 24
|
|
Data Science и Python18.12.2017, 22:24. Показов 1215. Ответов 2
Метки нет (Все метки)
Здравствуйте. Хочу перепрофилироваться в направлении Data Science.... интересует вопрос какую часть в работе занимают сугубо математические расчеты,которые нужно было учить на таких академических специальностях как прикладная математика, инженерия и т.д. Спасибо. И прошу давать вменяемые советы.
0
|
|
| 18.12.2017, 22:24 | |
|
Ответы с готовыми решениями:
2
Web или Data Science - где легче вход?
Нидерланды, Амстердам: Developer for Data Science team (Node.js, Python, SQL) |
|
5907 / 3359 / 1036
Регистрация: 03.11.2009
Сообщений: 10,008
|
|
| 18.12.2017, 23:22 | |
|
ИМХО
Если собираетесь заниматься всерьез, то для начала было бы неплохо ознакомиться с получить базовый объем знаний в статистике, методах машинного обучения, многомерном анализе и линейной алгебре, методах обработки и визуализации данных... Ну и, конечно, инструмент реализации, - R или Python. Добавлено через 2 минуты Но нужно ответить, что если начнете бросаться на все подряд - не выучите ничего, поэтому советую поговорить с практикующим дата-саентистом, а также проанализировать требования и рабочие обязанности вакансий с разных сайтов по поиску работы, обычно там написано, что именно нужно.
1
|
|
|
110 / 36 / 5
Регистрация: 27.12.2012
Сообщений: 130
|
|
| 19.12.2017, 11:57 | |
|
777lux, зависит от позиции. Сейчас модно называть многое Data Science, но частеннько это простое программирование и аналитика. Если реально говорить о Data Science, то много. И даже дело не во времени, а в том, что это база без которой никак и ты уже не Data Scientist.
Мое ИМХО, вам желательно знать: 1) Статистика: --- базовые знания (доверительные интервалы, тесты, максимум правдоподобия, метод моментов, работа с недостающими или неверными данными т.е. чистка базы., и т.д.) --- сокращение размерности данных (метод главных компонент и т.п. Если есть возможность обзавестись книгой Exploratory Multivariate Data Analysis by Example Using R, F. Husson, S. Lê & J. Pagès, 2017 (2nd edition) Авторы очень хорошо объясняют на примерах. --- методы классификации, не только базовые (kmean, EM, logit, HCPC, нейроные сети и тп, но и продвинутые SVM/kernel trick). --- регрессии (тут все очень зависит от работы, моделей много и в разных сферах применяются по разному, зависит так же от типа данных) 2) Математика --- Алгебра --- Векторная геометрия, матрицы --- Ну и все базовые знания 1-2 курса, могут всегда пригодиться. 3) Оптимизация --- Современные алгоритмы поиска максимума/минимума, их эффективность (речь не о программировании). Например самый известный метод Ньютотна, но он адски долго будет искать оптимум в сложных ситуациях... если вообще найдет. --- Уметь внедрять эти алгоритмы на R/Python 4) Разнообразные графики: --- Базовые --- Boxplot --- Histogramme --- Kernel --- Correlation matrix --- Correlogram (time series) 5) Возможно что-то специфическое из инженерии, в зависимости от фирмы и ваших задач. У меня коллеги например модделируют теплопотерии в зданиях или хорошо разбираются в электрических сетях. Можете начать с этой лекции на Coursera и с Титаника на kaggle. Еще важный момент, и тут я согласна с Jabbson, важно не распылятся. Базовые понятия, что я перечислила выше, знать нужно. Но углубленно нужно учить 1-3 вещи, полезные для вашей специализации. Т.е. вначале определиться где вы хотите работать и что делать. Посмотрите темы на kaggle с решеными соревнованиями, может помочь определится. П.с. некоторые термины на популярных сайтах Data Science - больше сленг программистов. Например features - математики и статистики так не говорят.
2
|
|
| 19.12.2017, 11:57 | |
|
Помогаю со студенческими работами здесь
3
Из аналитика в Data Science разработчика Первак с мечтой Data Science Data Science и Аналитик данных Data Science начинается с Deep Learning? Задача по статистике для data science - статистика, гипотеза, интервал, нормальное разпределение, т-распределение Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
|||
|
Символьное дифференцирование
igorrr37 13.02.2026
/ *
Логарифм записывается как: (x-2)log(x^2+2) - означает логарифм (x^2+2) по основанию (x-2).
Унарный минус обозначается как !
*/
#include <iostream>
#include <stack>
#include <cctype>. . .
|
Камера Toupcam IUA500KMA
Eddy_Em 12.02.2026
Т. к. у всяких "хикроботов" слишком уж мелкий пиксель, для подсмотра в ESPriF они вообще плохо годятся: уже 14 величину можно рассмотреть еле-еле лишь на экспозициях под 3 секунды (а то и больше),. . .
|
И ясному Солнцу
zbw 12.02.2026
И ясному Солнцу,
и светлой Луне.
В мире
покоя нет
и люди
не могут жить в тишине.
А жить им немного лет.
|
«Знание-Сила»
zbw 12.02.2026
«Знание-Сила»
«Время-Деньги»
«Деньги -Пуля»
|
|
SDL3 для Web (WebAssembly): Подключение Box2D v3, физика и отрисовка коллайдеров
8Observer8 12.02.2026
Содержание блога
Box2D - это библиотека для 2D физики для анимаций и игр. С её помощью можно определять были ли коллизии между конкретными объектами и вызывать обработчики событий столкновения. . . .
|
SDL3 для Web (WebAssembly): Загрузка PNG с прозрачным фоном с помощью SDL_LoadPNG (без SDL3_image)
8Observer8 11.02.2026
Содержание блога
Библиотека SDL3 содержит встроенные инструменты для базовой работы с изображениями - без использования библиотеки SDL3_image. Пошагово создадим проект для загрузки изображения. . .
|
SDL3 для Web (WebAssembly): Загрузка PNG с прозрачным фоном с помощью SDL3_image
8Observer8 10.02.2026
Содержание блога
Библиотека SDL3_image содержит инструменты для расширенной работы с изображениями. Пошагово создадим проект для загрузки изображения формата PNG с альфа-каналом (с прозрачным. . .
|
Установка Qt-версии Lazarus IDE в Debian Trixie Xfce
volvo 10.02.2026
В общем, достали меня глюки IDE Лазаруса, собранной с использованием набора виджетов Gtk2 (конкретно: если набирать текст в редакторе и вызвать подсказку через Ctrl+Space, то после закрытия окошка. . .
|