Новые профессии: Data Science

Get rich or die

На рынке трудоустройства сегодня сложилась довольно неоднозначная ситуация: с одной стороны, появились десятки новых профессий, с другой – обычному человеку невероятно сложно разобраться во всем этом многообразии. При этом на протяжении нескольких лет продолжает сохраняться одна тенденция – во всем мире (и в России в частности) экспоненциальными темпами растет спрос на IT-специалистов – и в последующие годы этот спрос будет только расти. Такая востребованность вызвана глобализацией современного мира и низким процентом квалифицированных сотрудников, обладающих необходимыми знаниями.

Get rich or die

В то же время, работодатели понимают, что в ближайшем будущем людей, выполняющих монотонную работу, не требующую каких-либо специальных навыков (таксисты, грузчики, операторы call-центров и пр.), заменят роботы и нейросети, а опытные сотрудники все также останутся в цене. Стоит также отметить, что бум популярности гуманитарных профессий, наблюдавшийся 10-15 лет назад породил огромное количество юристов, экономистов, лингвистов и психологов, которые сейчас остаются без работы ввиду переизбытка подобных соискателей. Тем временем, все вышеописанные проблемы ни в коей мере не касаются программистов, веб-дизайнеров, ИИ-девелоперов и прочих IT-специалистов.

Небольшое предисловие

Сегодня мы расскажем вам о Data Science, вернее о том, как начать работать в данной области, где приобрести первые знания и какие перспективы сулят тем, кто выберет этот путь. Прежде всего, стоит определиться с самим понятием Data Science – это наука о данных, если точнее, это раздел информатики занимающийся анализом, обработкой и представлением в цифровой форме больших объемов данных. Кстати, о Больших Данных: при изучении Data Science вы непременно познакомитесь с big data – если вкратце, то чаще всего это понятие подразумевает данные о действиях, совершаемых пользователями на тех или иных сайтах. Например, каждый из вас, впервые попав на незнакомый сайт сталкивался с уведомлением о сборе cookie, хранящих историю вашей активности на конкретном ресурсе (какие страницы посещали, какие кнопки нажимали, где задерживались дольше всего и т.д.). А представьте, сколько таких данных остается после десятков/сотен тысяч или даже миллионов пользователей. И всю эту информацию необходимо систематизировать, визуализировать и вычленить самое интересное.

Data Science

Для этого существует профессия Data Scientist – эксперт по аналитическим данным, обладающий техническими навыками для решения сложных задач, а также энтузиазмом, позволяющим такие задачи ставить. От Data Scientist требуется знание и понимание принципов работы нейросетей, методов статистического анализа данных, умение построения математических моделей и способность быстро находить закономерности.

Как стать Data Scientist?

Как стать Data Scientist?

Здесь есть два варианта: медленный, но относительно легкий либо быстрый, но более сложный для восприятия. Первый кейс больше подойдет юным абитуриентам, заканчивающим школу: здесь вам придется потратить несколько лет своей жизни получение соответствующего высшего образования в Университете Иннополиса, МГУ им. Ломоносова (Факультет вычислительной математики и кибернетики), МФТИ (Кафедра анализа данных) или НИУ ВШЭ (Факультет бизнес-информатики); если же говорить о зарубежных ВУЗах, то среди них лучшими по подготовке Data Science-специалистов считаются Оклендский университет, университет Южной Калифорнии, Вашингтонский университет, Бизнес-школа имперского колледжа Лондона и университет Данди.

Во втором случае, проще будет зрелым людям, решившим изменить направление своей карьеры в максимально сжатые сроки. Речь об онлайн-курсах, дающих возможность за 5-7 месяцев получить неплохие знания по Data Science, достаточные для того, чтобы практически сразу по завершении курса найти первую работу по новой специальности.

Как стать Data Scientist?

В мире онлайн-образования также существуют два пути: можно пытаться самостоятельно искать необходимые учебные материалы в Сети безо всякой программы и возможности посоветоваться с кем-то уже работающим Data Scientist, либо не тратить время на поиск релевантной информации и воспользоваться услугами платных образовательных ресурсов, которые за разумные деньги предоставят вам комплексные упорядоченные знания, обязательные для каждого хорошего специалиста по работе с Big Data. Помимо того, вы вольетесь в закрытое комьюнити единомышленников, готовых поделиться опытом и подсказать что делать при возникновении каких-либо сложностей.

Как стать Data Scientist?

На большинстве платных курсов набор преподаваемых технологий мало чем отличается друг от друга, благодаря чему любой потенциальный студент гарантированно освоит:

  • Сведение и чистку данных
  • Создание аналитических и эконометрических моделей
  • Работу в Google Colab
  • Deep Learning и построение нейросетей
  • Программирование на Python и знание основных библиотек этого языка
  • Трудоустройство: с чего начать и куда идти

Впрочем, некоторые образовательные учреждения выгодно отличаются на фоне конкурентов за счет более высокого уровня преподаваемых знаний и отличной практической составляющей. И даже среди них не каждое может дать полное профильное образование по специальности Data Scientist, пожалуй, исключением является онлайн-школа SkillFactory с направление “Специализация Data Scientist”, где среди основных направлений можно выбрать специализацию, идеально подходящую именно вам. В SkillFactory регулярно запускают новые учебные программы, и студенты могут выбрать среди таких направлений обучения как:

  • Data Science. Здесь вам в понятной форме объяснят все вещи, о которых мы говорили выше, а именно – Python, классическое машинное обучение, нейросети и Deep Learning, основы Big Data и Data Engineering, причем основной упор будет сделан именно на реальные практические навыки, а также позволит к концу обучения собрать внушительный Git-репозиторий, который будет не стыдно продемонстрировать будущему работодателю.
  • Machine Learning. Курс ведут опытные преподаватели, не один год проработавшие в крупных корпорациях. Одним из главных преимуществ направления Machine Learning от SkillFactory является тщательно оптимизированная программа, включающая только необходимые знания, которые можно освоить за 11 недель.
  • Big Data MBA. Интересный факт – в 2019 году 92% компаний из списка Fortune 1000 значительно увеличат инвестиции в Big Data и AI, поскольку умение использовать эти технологии в бизнес-целях все больше влияет на успех любого крупного предприятия. На курсе Big Data MBA студенты научатся понимать алгоритмы работы машинного обучения, получат объем знаний, достаточный для того, чтобы самостоятельно от начала и до конца сформировать Big Data-стратегию, а также пройдут 85-бизнес кейсов и лично выполнят 3 проекта.
  • Аналитик данных. Человек, умеющий извлекать пользу из большого количества хаотично упорядоченных данных, сегодня востребован в буквально любой сфере бизнеса. Начинающий аналитик должен быть готов в сжатые сроки освоить SQL, статистику, Python, Google Таблицы и прочие musthave-инструменты этой специальности. В онлайн-школе SkillFactory за 6 месяцев дадут новичкам все знания, необходимые для успешного старта карьеры аналитика, а уже работающим профессионалам помогут до совершенства отточить имеющиеся навыки.
  • Нейронные сети. Если вас интересуют нейросети, и вы хотели бы более глубоко внедриться в эту тему, то на курсе, посвященном нейронным сетям можно узнать как работает Deep Learning, овладеть основными библиотеками для Deep Learning (Tensor Flow, Kevas и пр.), создать свою первую нейросеть для распознавания рукописных цифр, и даже поработать над реальными проектами, среди которых будут разработка чат-бота, создание модели для распознавания лиц и генерации несуществующих лиц.

Как бы не были хороши платные курсы, сперва лучше попробовать свои силы на бесплатных ресурсах – а уж если почувствуете, что тема Data Science вас действительно заинтересовала и хочется чего-то большего, можно вкладываться в дальнейшее обучение. Из бесплатных курсов можем порекомендовать следующие:

  • A crash course in Data Science от Coursera познакомит с базовыми принципами работы с Большими данными, расскажет о базовых понятиях и роли Data Science в бизнесе, не углубляясь в дебри терминологии.
  • StepiK Contest. Data Science примечателен своим умением адаптироваться под знания каждого отдельного студента.
  • Data Science Essentials может похвастаться большим количеством информации, полезной не столько новичкам, сколько тем, кто уже находится в процессе освоения новой профессии. К примеру, на этом курсе учат как собирать данные, подготавливать массивы к обработке, извлекать из них самое важное и визуализировать результаты.
  • Data Scientist’s Toolbox также создан авторами Coursera и является не теоретическим, а практическом курсом, который поможет новичку разобраться с типами данных и методологиями обработки информации, а также объяснит, как пользоваться самыми популярными инструментами: Git, R и Rstudio.
  • Building a Data Science team расскажет, как собрать команду для аналитики больших данных, где и по каким критериям искать хороших специалистов и как правильно распределить роли в команде для максимально продуктивной работы.

Работа на должности Data Scientist привлекательна и тем, что технологии обработки Больших Данных широко применяются не только в IT-индустрии, но и в финансовых структурах, телекомпаниях, крупных торговых сетях, избирательных кампаниях. Россия является одним из мировых лидеров по количеству свободных вакансий для “цифровых” профессионалов. Так, с 2012 спрос на Data Scientist вырос в 20(!) раз, а об острой нехватке таких людей открыто заявляют крупнейшие отечественные и западные корпорации, среди которых Альфа-Банк, Wargaming, Сбербанк, Mail.ru Group, Home credit Bank, Nvidia, e-legion, Beeline, Мегафон и многие другие.

Оплата

Оплата

Как мы уже говорили ранее, Data Scientist – одна из самых востребованных профессий в IT. Соответственно, и уровень оплаты труда у подобных специалистов на голову выше, чем у их коллег из смежных областей. Если говорить о Москве, то столичный уровень зарплат Data Scientist составляет 70 000 – 80 000 рублей в месяц для начинающих специалистов и до 300 тысяч у опытных профессионалов, имеющих за плечами 5+ лет работы с Big Data. В регионах, как правило, зарплаты на 20-25% ниже, но спрос на квалифицированные кадры столь же высок, поэтому грамотный Data Scientist не останется без работы, где бы он не находился. Если говорить о зарубежных IT-компаниях, то средняя зарплата американского Data Scientist равна 91$ тысяче в год.

Вывод

Data Science

Data Science – относительно молодая профессия (сам термин возник в 2008) и хороших специалистов в ней очень немного. При этом, в ближайшие годы каждый Data Scientist будет цениться на вес золота. Почему? Все просто: во-первых, растет сам объем Интернета, количество активных пользователей и генерируемых ими данных – сейчас из 7.5 млрд человек доступ в Интернет имеют менее половины, представьте, что начнется, когда с распространением 5G и спутникового Интернета доступ к Сети получат жители Африки, Индии, Азии и прочих развивающихся стран. Во-вторых, тот, кто начнет учиться сегодня, через пару лет будет обладать существенным багажом знаний, способных затмить любого зеленого новичка. Поэтому вывод может быть только один – начинайте учиться Data Science прямо сейчас, чтобы не “остаться за бортом” в будущем. Если мы до сих пор вас не убедили, то не поленитесь и прочитайте статью о том, как даже 70-летние пенсионеры несмотря на свой возраст успешно учатся программированию.