Всё обучение
Экономика и финансы
IT
Дизайн
Маркетинг
Менеджмент
Продажи
HR
Бизнес
Реклама и PR
Госслужба
Закупки и логистика
Образование
Юриспруденция
Лингвистика
Психология
Самообразование
Спорт
Киберспорт
Искусство и культура
Медицина
Туризм и сервис
Строительство
Теплоэнергетика и теплотехника
Электроэнергетика и электротехника
Техносферная безопасность
Нефтегазовое дело
Экология и природопользование
Промышленность
Сельское хозяйство
Транспорт
СМИ и медиа
Физика и инженерия
Геодезия
Химия
Энергомашиностроение
Машиностроительные технологии
Биология и биотехнологии
Нанотехнологии и наноматериалы
Социология
История
Филология
Математика и компьютерные науки
Ветеринария
Beauty-индустрия
Философия
Культурология
Политика и политология
Документоведение
image
icon
Редакция Synergy HUB
1 публикация
#Статьи
20 декабря 2021 г.

Чем занимается data scientist и как им стать

Рассказываем, в чём суть профессии, без которой в современном мире не обойтись.
Время чтения 5 минут

Современные компании вынуждены разбираться в огромном количестве разрозненных данных. Способность преобразовывать море информации в практические идеи позволяет решить многие задачи ― от разработки новых методов лечения диабета до выявления и предотвращения угроз национальной безопасности. Поэтому и частные компании, и государственные учреждения нанимают профессионалов в области data science (науки о данных). Специалисты по обработке данных применяют компьютерные технологии, моделирование, статистику, аналитику, математические и бизнес-инструменты, чем помогают организациям принимать объективные решения. В этой статье разберёмся, как освоить профессию, кому она подходит и какими навыками должен обладать профессиональный data scientist.

Роль и обязанности data scientist

Data scientist тесно сотрудничает со всеми заинтересованными сторонами в бизнесе. Он должен понять их цели и определить, какие данные и как использовать для достижения этих целей. Data scientist делает проекты моделирования данных, создаёт алгоритмы и прогнозные модели, чтобы извлечь нужную информацию. Также он помогает анализировать данные и делится ими с коллегами.

Каждый проект индивидуален, но обычно data scientist строит процесс сбора и анализа данных следующим образом:

  1. задаёт правильные вопросы заказчикам, чтобы начать процесс поиска;
  2. получает данные;
  3. обрабатывает данные;
  4. интегрирует и хранит данные;
  5. делает предварительный анализ данных;
  6. выбирает один или несколько подходящих алгоритмов;
  7. применяет машинное обучение, статистическое моделирование, искусственный интеллект;
  8. измеряет и улучшает результаты;
  9. представляет окончательные результаты заказчикам;
  10. вносит изменения на основе отзывов;
  11. повторяет процесс, чтобы решить следующую проблему.

Кем может работать data scientist

Самые распространённые карьерные направления для дата-сайентиста:

  • специалист по обработке данных (data scientist) ― занимается проектированием процессов моделирования данных, создаёт алгоритмы и прогнозные модели, проводит пользовательский анализ;
  • аналитик данных (data analyst) ― управляет большими базами данных, выявляет тенденции и формирует выводы, на основе которых компания принимает стратегические решения;
  • инженер по обработке данных (data engineer) ― обрабатывает, агрегирует и систематизирует данные из разных источников и размещает их в специальных хранилищах;
  • архитектор данных (data architect) ― проектирует архитектуру данных организации и управляет ей.

Часто специалист в области data science совмещает несколько ролей. Но обязанности data scientist и data analyst существенно различаются. Первый разрабатывает процессы моделирования данных, второй изучает наборы данных, выявляет тенденции и делает выводы. Деятельность data scientist требует больше технических знаний, поэтому эта позиция выше, чем должность data analyst. Однако обе профессии доступны при одинаковом образовании.

Направления в сфере Программирование
Программирование
Базы данных

Карьерный рост в data science

В data science легко построить карьеру. Так, сайт Glassdoor (США) пять лет подряд оценивал дата-сайентиста как одну из 10 лучших профессий в Америке, исходя из средней зарплаты, количества активных вакансий и степени удовлетворённости сотрудников. В России же и в странах СНГ, по данным РБК, ещё шесть лет назад о сфере data science никто не знал. Но совместное исследование портала hh.ru, VK (Mail.ru Group) и Академии больших данных MADE показало, что в 2019 году вакансий дата-сайентистов на рынке труда стало почти в 10 раз больше, чем в 2015 году. Более свежие данные еще не были опубликованы 

Вот как выглядят ступени вертикальной карьеры в data science:

  • стажёр — начинающий специалист, которого многие компании берут без опыта работы, достаточно базовых знаний и профессиональных навыков;
  • junior — на эту позицию достаточно опыта работы от года, хотя в некоторых компаниях джунов не отделяют от стажёров;
  • middle — опытный сотрудник, готовый к самостоятельной работе над проектом, но его пока не могут взять на руководящую позицию;
  • senior — уверенный в своих навыках специалист с опытом от пяти лет, он уже возглавлял работу над проектом и может руководить структурной единицей в компании;
  • CDO или директор по управлению данными — он отвечает за работу с данными во всей компании, как правило, такие позиции предусмотрены в крупном бизнесе.

Ценность работы с большими данными понимают все ― от небольших стартапов до компаний из списка Fortune 500 (рейтинг 500 крупнейших мировых компаний, критерием составления которого служит выручка компании. Список составляется и публикуется ежегодно журналом Fortune. ― Прим. ред.) и государственных учреждений.

Главный экономист корпорации Google Хэл Вэриан говорил о необходимости дата-сайентистов еще в 2009 году в интервью изданию McKinsey Quarterly. В отчёте соцсети LinkedIn 2020 года data science признана одной из самых перспективных вакансий. А учитывая нехватку специалистов в данной сфере, можно утверждать, что сейчас подходящее время для освоения профессии data scientist и выхода на биржу труда.

Сколько получает data scientist

На hh.ru дата-сайентисты ― стажёры могут получать от 60 тысяч рублей в месяц. Зарплата топов достигает 500 тысяч рублей в месяц. С опытом data scientist переходит на более высокие должности, и его доход растёт. Также зарплата зависит от компании и региона.

Основные навыки data scientist

Большинству дата-сайентистов в повседневной работе нужны следующие навыки:

  • Статистический анализ. Выявление закономерностей в данных, обнаружение паттернов и аномалий.
  • Машинное обучение. Построение алгоритмов и статистических моделей, на основе которых компьютер будет обрабатывать данные автоматически.
  • Информатика. Применение принципов искусственного интеллекта, систем баз данных, взаимодействия человека и компьютера, численного анализа, разработки программного обеспечения.
  • Программирование. Написание компьютерных программ и анализ больших наборов данных для решения сложных задач. Data scientist должен уметь кодить на языках Java, R, Python, SQL.
  • Презентация данных. Представление полезной информации, зачастую для не подготовленной аудитории.

Data scientist играет ключевую роль в принятии руководством компании правильных решений. Поэтому им нужны следующие личные навыки (soft skills):

  • Бизнес-интуиция. Общение с заказчиками даёт более полное представление о проблемах, которые они хотят решить;
  • Аналитическое мышление. Для решения абстрактных бизнес-проблем.
  • Критический склад ума. Для объективного анализа фактов и правильных выводов.
  • Любознательность. Чтобы избежать поверхностных суждений и найти более «глубинные» закономерности в данных.
  • Коммуникативность. Придётся много общаться с сотрудниками организации на всех уровнях.

Направления в сфере Программирование
Программирование
Базы данных

С чего начать карьеру в data science

Большинству работодателей нужны специалисты с высшим образованием. Обязательно надо знать основы IT и математики, а затем пройти дополнительное обучение в области data science или смежной сфере (например, data analytics).

Образовательные программы в отрасли data science обычно включают изучение методов прогнозной аналитики, статистического моделирования, работы с большими данными, приложений для интеллектуального анализа данных, корпоративной аналитики, технологий принятия решений на основе данных, визуализации данных, сторителлинга.

Преподаватели курсов часто делятся со студентами опытом. Это позволяет из первых уст получить информацию о главных проблемах, с которыми сталкиваются начинающие дата-сайентисты.

Опыт работы с большими данными может быть полезен специалистам смежных областей. После обучения они смогут применять в своей деятельности статистические инструменты, технологии бизнес-аналитики, логические приёмы для решения сложных проблем. А также специалисты смогут согласовывать данные из разнородных источников. Большая часть курсов основаны на практике. Студенты учатся, составляя портфолио на основе реальных проектов.


Статьи по теме Программирование




 

#Data science
#Программирование
#IT
#Веб-аналитика
#Обзор профессии