Форум программистов, компьютерный форум, киберфорум
Python
Войти
Регистрация
Восстановить пароль
 
Рейтинг 4.67/3: Рейтинг темы: голосов - 3, средняя оценка - 4.67
0 / 0 / 0
Регистрация: 21.05.2013
Сообщений: 24
1

Data Science и Python

18.12.2017, 22:24. Показов 530. Ответов 2
Метки нет (Все метки)

Здравствуйте. Хочу перепрофилироваться в направлении Data Science.... интересует вопрос какую часть в работе занимают сугубо математические расчеты,которые нужно было учить на таких академических специальностях как прикладная математика, инженерия и т.д. Спасибо. И прошу давать вменяемые советы.
0
Programming
Эксперт
94731 / 64177 / 26122
Регистрация: 12.04.2006
Сообщений: 116,782
18.12.2017, 22:24
Ответы с готовыми решениями:

Web или Data Science - где легче вход?
Здравствуйте, Освоил Python на таком уровне, что далее нужно уже выбирать профессиональную...

Data store in Python
Разработать базу данных или хранилище данных, работающую в интерактивном режиме и предусмотреть...

Первак с мечтой Data Science
ребят подскажите пожалуйста , можно ли работать после первого курса в IT компании , на летний...

Из аналитика в Data Science разработчика
Всем привет! Прошу совета от людей, знающих python и разбирающихся в машинном обучении. На...

2
Эксперт по компьютерным сетям
4817 / 2715 / 833
Регистрация: 03.11.2009
Сообщений: 8,393
Записей в блоге: 3
18.12.2017, 23:22 2
ИМХО
Если собираетесь заниматься всерьез, то для начала было бы неплохо ознакомиться с получить базовый объем знаний в статистике, методах машинного обучения, многомерном анализе и линейной алгебре, методах обработки и визуализации данных... Ну и, конечно, инструмент реализации, - R или Python.

Добавлено через 2 минуты
Но нужно ответить, что если начнете бросаться на все подряд - не выучите ничего, поэтому советую поговорить с практикующим дата-саентистом, а также проанализировать требования и рабочие обязанности вакансий с разных сайтов по поиску работы, обычно там написано, что именно нужно.
1
110 / 36 / 5
Регистрация: 27.12.2012
Сообщений: 128
19.12.2017, 11:57 3
777lux, зависит от позиции. Сейчас модно называть многое Data Science, но частеннько это простое программирование и аналитика. Если реально говорить о Data Science, то много. И даже дело не во времени, а в том, что это база без которой никак и ты уже не Data Scientist.

Мое ИМХО, вам желательно знать:
1) Статистика:
--- базовые знания (доверительные интервалы, тесты, максимум правдоподобия, метод моментов, работа с недостающими или неверными данными т.е. чистка базы., и т.д.)
--- сокращение размерности данных (метод главных компонент и т.п. Если есть возможность обзавестись книгой Exploratory Multivariate Data Analysis by Example Using R, F. Husson, S. Lê & J. Pagès, 2017 (2nd edition) Авторы очень хорошо объясняют на примерах.
--- методы классификации, не только базовые (kmean, EM, logit, HCPC, нейроные сети и тп, но и продвинутые SVM/kernel trick).
--- регрессии (тут все очень зависит от работы, моделей много и в разных сферах применяются по разному, зависит так же от типа данных)
2) Математика
--- Алгебра
--- Векторная геометрия, матрицы
--- Ну и все базовые знания 1-2 курса, могут всегда пригодиться.
3) Оптимизация
--- Современные алгоритмы поиска максимума/минимума, их эффективность (речь не о программировании). Например самый известный метод Ньютотна, но он адски долго будет искать оптимум в сложных ситуациях... если вообще найдет.
--- Уметь внедрять эти алгоритмы на R/Python
4) Разнообразные графики:
--- Базовые
--- Boxplot
--- Histogramme
--- Kernel
--- Correlation matrix
--- Correlogram (time series)
5) Возможно что-то специфическое из инженерии, в зависимости от фирмы и ваших задач. У меня коллеги например модделируют теплопотерии в зданиях или хорошо разбираются в электрических сетях.

Можете начать с этой лекции на Coursera и с Титаника на kaggle.

Еще важный момент, и тут я согласна с Jabbson, важно не распылятся. Базовые понятия, что я перечислила выше, знать нужно. Но углубленно нужно учить 1-3 вещи, полезные для вашей специализации. Т.е. вначале определиться где вы хотите работать и что делать. Посмотрите темы на kaggle с решеными соревнованиями, может помочь определится.

П.с. некоторые термины на популярных сайтах Data Science - больше сленг программистов. Например features - математики и статистики так не говорят.
2
IT_Exp
Эксперт
87844 / 49110 / 22898
Регистрация: 17.06.2006
Сообщений: 92,604
19.12.2017, 11:57

Заказываю контрольные, курсовые, дипломные работы и диссертации здесь.

Совместное прохождение курса Introduction to Computer Science and Programming Using Python
Привет всем. В двух словах, есть такой ресурс edX. На нем выкладываются университетские курсы от...

Error BC30466: Namespace or type 'Data' for the Imports 'System.Data' cannot be found
.NET beta 2 Пытаюсь писать vb под asp.net и откомпилять в dll... Вот заголовок: Imports System...

Объявить переменную типа Data и присвоить ей значение из поля Data
Объявляю переменную типа ДАТА и пытаюсь присвоить ей значение из поля ДАТА Табблицы1 Dim d1 as...

Export data from SQL server (using VB) in new text file and return data
Всем общий привет! Ребята, прошу прощения за дилетантский вопрос, но все когда-то приходится...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
3
Ответ Создать тему
Опции темы

КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin® Version 3.8.9
Copyright ©2000 - 2021, vBulletin Solutions, Inc.