Наука о данных продолжает развиваться как один из наиболее перспективных и востребованных путей карьерного роста квалифицированных специалистов. Сегодня успешные специалисты по работе с данными понимают, что они должны преодолеть традиционные навыки анализа больших объемов данных, интеллектуального анализа данных и программирования. Чтобы раскрыть полезные для своих организаций умственные способности, ученые, занимающиеся данными, должны овладеть всем спектром жизненного цикла науки о данных и обладать уровнем гибкости и понимания, позволяющим получать максимальную отдачу на каждом этапе этого процесса.

На изображении представлены пять этапов жизненного цикла науки о данных: Захват (сбор данных, ввод данных, прием сигналов, извлечение данных); Поддержка (хранение данных, очистка данных, стажировка данных, обработка данных, архитектура данных); Обработка (добыча данных, кластеризация/классификация, моделирование данных, обобщение данных); Анализ (исследовательский/подтверждающий, прогностический, регрессионный, текстовый, качественный анализ); Коммуникация (отчетность по данным, визуализация данных, бизнес-анализ, принятие решений).

Термин “специалист по сбору данных” был написан еще в 2008 году, когда организации осознали потребность в информационных специалистах, талантливых в сортировке и препарировании огромных объемов информации (Big data). 1 В статье McKinsey&Company за 2009 год Хэл Вариан, центральный финансовый эксперт Google и преподаватель информатики, бизнеса и финансов UC Berkeley, предвосхитил важность адаптации к влиянию инноваций и реконфигурации различных предприятий. 2

“Способность принимать информацию – иметь возможность ее получать, обрабатывать, концентрировать стимул от нее, воображать, передавать – будет колоссальной способностью в последующие десятилетия”.

– Хал Вариан, босс-финансовый специалист в Google и UC Беркли Преподаватель информатики, бизнеса и финансовых аспектов 3

Исследователи, обладающие достоверной информацией, могут различать значительные запросы, собирать информацию из большого количества различных источников информации, сортировать данные, преобразовывать результаты в договоренности, а также передавать свои открытия таким образом, чтобы это оказало решающее влияние на выбор бизнеса. Эти способности требуются практически во всех начинаниях, что делает талантливых исследователей информации все более и более важными для организаций.

Что делает ученый, изучающий данные?

В предыдущее десятилетие исследователи информации оказались фундаментальным ресурсом и доступны практически во всех ассоциациях. Эти эксперты – сбалансированные, ориентированные на информацию люди с повышенным уровнем специализированных способностей, которые подходят для структурных сложных количественных расчетов, чтобы отсортировать и систематизировать множество данных, используемых для решения вопросов и продвижения техники в их ассоциациях. Это сочетается с вовлечением в переписку и администрирование, которое, как ожидается, принесет значительные результаты различным партнерам по ассоциации или бизнесу.

Ученые, занимающиеся данными, должны быть любознательными и ориентированными на результат, обладающими исключительными отраслевыми знаниями и коммуникационными навыками, которые позволяют им объяснять высокотехнологичные результаты своим нетехническим коллегам. Они обладают сильным количественным фоном в статистике и линейной алгебре, а также знанием программирования с акцентом на хранение данных, добычу и моделирование для построения и анализа алгоритмов.