Гайд ІТ-професіями

Це детальний огляд 20 професій в ІТ: якими навичками потрібно володіти, які на тебе чекають обов’язки та скільки зароблятимеш. А також чесний погляд представників професії на роботу у їхньому напрямку.

Data Scientist

Data Scientist або Data Science Engineer ‒ це фахівець, який працює з величезними, просто здоровенними обсягами неструктурованої інформації. Щоб працювати з такими даними, використовують математичну статистику та методи машинного навчання. 

Дата-саєнтисти створили безліч речей, якими ти користуєшся щодня: це і прогноз погоди, і різноманітні чат-боти, і голосові помічники. Ще у 2012-му Harvard Business Review назвав професію Data Scientist “найпривабливішою роботою 21-го століття”. Відтоді мало що змінилося, попит на спеціалістів у сфері аналітики даних з кожним роком лише збільшується.

Чим займається:

Основне завдання фахівців DS ‒ зібрати та впорядкувати бази даних, знайти у них зв’язки та закономірності. А на основі отриманої інформації створити модель машинного навчання (ML), яка дасть можливість спрогнозувати або передбачити результати роботи у майбутньому. Майже як провидець, але на відміну від них, прогнози дата-саєнтистів збуваються майже завжди. 

Отже, головні функції цього фахівця такі: 

  • Збір даних. Зокрема, пошук джерел і способів отримання інформації.
  • Перевірка та аналіз: виявлення аномалій, вивчення даних, побудова припущень та висновків.
  • Візуалізація. Побудова графіків та діаграм з дослідженнями.
  • Формування результатів. Побудова стратегії на основі аналізованих даних.
  • Написання програм для автоматизації збору та обробки інформації.
  • Розробка прогностичних моделей та машинних алгоритмів для оперування великими обсягами інформації.

Це основні завдання так званого Full Stack Data Scientist. Однак, у великих компаніях досить поширене розділення Data Science на спеціалізації. Так, тех-гіганти окрім Data Scientist, також наймають Big Data Engineer та Machine Learning Engineer. Розберемо трохи детальніше, чим займаються ці фахівці.

  • Big Data Engineer: цей спеціаліст займається збором даних та їх підготовкою для роботи аналітиків та дата-саєнтистів. Це охоплює завантаження даних з різних джерел, їх очищення та регулярне оновлення. А також сортування по зрозумілих базах в таблицях. Відтак, для успішної роботи дата-інженер повинен мати глибокі знання у програмуванні на Python або Java, а також розуміти, як влаштовані ті бази даних. 
  • Machine Learning Engineer: це спеціаліст, який за допомогою великих обсягів даних та алгоритмів, які зазвичай створює разом з дата-саєнтистом, навчає штучний інтелект. Наприклад, саме через цього фахівця у тебе в соцмережах з’являється реклама кросівок, які ти нещодавно гуглив. Такі спеціалісти добре програмують, уміють працювати зі стримінговими даними і, головне, знають, як використовувати моделі машинного навчання будь-якої складності та інтегрувати їх з іншими системами.

Які скіли потрібні:

Сильна математична база. Матаналіз та теорія ймовірностей, статистичний аналіз, дискретна математика і лінійна алгебра ‒ без усього цього робота дата-саєнтиста неможлива. 

Уміння діяти оригінально. Кожне завдання може стати справжньою квест-кімнатою, бо у будь-якому масиві даних багато різних таємниць, і щоб розгадати деякі, потрібно мислити нестандартно.

Комунікабельність. Неякісна комунікація дата-саєнтиста може дорого обійтися компанії. Успіх проєкту часто залежить від того, наскільки чітко були обговорені потреби клієнта, донесена інформація про джерела даних, методи їх обробки і потенційні ризики у ході дослідження.

Знання англійської мови. У професії, яка навіть називається англійською, без неї не обійтися. Для навчання, розуміння технічних інструкцій і, найголовніше, спілкування з клієнтами англійська потрібна першочергово.

Розуміння Machine Learning і Deep Learning. Потрібно розібратися з основними моделями і алгоритмами, які завдання вони вирішують, і також вивчити бібліотеки і фреймворки, які використовуються для цього.

Знання мов програмування. Наразі найпопулярнішою є Python. Вона дозволяє вирішувати усі основні “технічні” задачі, котрі постають перед інженером у ході підготовки даних, перевірки і презентації гіпотез.

Базове розуміння концепцій обробки даних. Вони дозволять правильно структурувати дані для подальшого їхнього опрацювання, візуалізації і моделювання.

Уміння візуалізовувати дані. Для цього варто ознайомитися з ggplot2, rbokeh для R. Або matplotlib для інтерактивної візуалізації.

Скільки можна заробляти

Data Scientist ‒ одна з найбільш затребуваних спеціальностей, попит на яку досі зростає, відповідно і заробітні плати цих фахівців достойні: Junior ‒ $1000-2000, Middle ‒ $2500-3500, Senior ‒ $4000-8000+.

Де навчатися:

Національний університет “Львівська політехніка”.

Програма:
Business Analytics & Data Science / Системний аналіз F4

Київський Авіаційний Інститут

Програма:
Intelligent Systems / Інформаційні системи і технології F6

Лайфхаки від ментора:

Олена Доманська

Head of Data Science, Avenga Ukraine

Перш за все, варто зрозуміти, чи вам до душі проводити час з даними, глибоко їх копати і аналізувати. Бо саме цим ви будете займатися 80% часу. Крім того, вам мають бути цікаві складні задачі та челенджі. А ще вам має бути комфортно комунікувати про свої результати. Якщо все це про вас, то ви дата-саєнтист за натурою і вам потрібно рухатися вперед. 

І почати потрібно з удосконалення знань з математики та програмування. Математика ‒ це ключова дисципліна. Вона потрібна для того, щоб інтуїтивно та теоретично зрозуміти різні концепції дата-саєнсу. Програмування, своєю чергою, дозволить практично реалізувати ці концепції та ідеї. 

Варто також бути наполегливим і мати бажання досягти своїх цілей. Адже не завжди буде легко, це я вам гарантую. Робота з даними не буває простою, не все буде виходити з першого разу. Але з часом ви отримаєте практичні навички і вам вже буде легше оминати пастки. Для початку потрібно мати терпіння і не боятися невдач, адже це і є ваш досвід.

Скопійовано!