인사이트
데이터 사이언티스트가 하는 일은?ㅣ데이터 사이언스 정의부터 하루 일과까지
2022년 06월 20일
데이터 사이언스, 낯설게만 느껴지시나요? 그러나 데이터 사이언스를 활용한 서비스는 이미 우리 생활 속 깊은 곳까지 자리하고 있습니다.
스마트폰과 각종 전자기기에 탑재된 음성 인식 기술부터 시작해서 유튜브, 넷플릭스 등의 추천 알고리즘까지. 데이터 사이언스를 활용한 대표적인 서비스라고 할 수 있는데요. 많은 기업이 이러한 데이터 사이언스를 기반으로 서비스를 고도화하고 있습니다.
데이터 사이언티스트 직무에 대해 궁금해하실 분들을 위해 데이터 사이언스 정의와 데이터 사이언티스트가 하는 일, 필요한 역량에 대해 정리했습니다.
데이터 사이언스는 인공지능의 하위개념으로 과학적 방법론과 공학적 측면을 다루는 학문을 말합니다.
일반적으로 알고 있는 통계분석, 딥러닝, 기계학습 등을 통해 데이터로부터 통찰을 얻는 것이 과학적 방법론에 해당하며, 방대한 데이터를 획득(수집, 변환, 저장)→ 정제→ 모델링→ 분석/시각화 등의 과정을 통해 해결해야 하는 문제에 대해 솔루션을 제공하고 개선하는 것이 공학적인 측면이라고 할 수 있습니다.
앞서 말씀드린 전문 용어가 다소 어렵고 생소하실 수 있는데요. 각 용어에 대한 정의는 아래 내용을 참고해주세요!
데이터 직군은 다양한 포지션이 있지만, 크게 데이터 사이언티스트, 데이터 엔지니어, 데이터 분석가로 나뉩니다. 이해하기 쉽게 개발자와 기획자의 성향을 비유를 들어 설명해 드리자면 아래 표와 같이 나누어 보는 것도 어느 정도 도움이 됩니다.
데이터를 해석하며 그 속에 담긴 인사이트를 도출하고 의사결정에 영향을 주는 일에 기여하고 싶은 분이라면 기획자 성향에 가까운 데이터 분석가, 문제를 해결하기 위해 솔루션을 직접 만드는 것에 기여하고 싶은 분이라면 개발자 성향에 가까운 데이터 엔지니어 포지션이라고 할 수 있죠.
데이터 직군은 서비스 준비를 위해 데이터를 획득하는 단계부터 서비스를 배포하는 과정까지 다양한 업무를 수행하게 되는데요. 과정별 수행하게 되는 회사마다 차이는 있으나 대부분 아래와 같은 업무를 수행합니다.
데이터 분석가와 데이터 엔지니어, 데이터 사이언티스트의 구분이 다소 어렵고 모호하실 수 있는데요. 해당 아티클에서는 데이터 사이언티스트 직무를 현업의 알고리즘 기술 및 시스템 성능 향상과 비즈니스 인사이트 도출까지 전 영역에서 활동하는 제너럴리스트로 정의하고 있습니다.
데이터 사이언티스트를 한마디로 정의한다면 데이터 사이언스를 통해 인간의 삶의 질을 향상하는 사람이라고 할 수 있습니다.
소속된 기업의 도메인에 따라 축적된 데이터, 활용 목적에 따라 데이터 수집-탐색-분석 과정에서 얻게 된 데이터를 기반으로 특성에 맞는 인공지능 기술을 적용하여 최적의 인사이트를 찾습니다.
(ex. 패션 회사 : 다음 시즌에 유행할 색상과 스타일 분석, 식음료 회사 : 맥주와 어울리는 과자 추천 등)
필요한 기본소양과 스킬은 데이터 분석을 위한 통계 및 수학적 지식, 데이터 전처리 및 모델링을 위한 코딩 능력, 해당 분야에 대한 비즈니스 도메인 지식 등이 요구되며 업무 특성상 부서 내부 및 외부 구성원들과 협업을 자주 하게 되므로 커뮤니케이션 능력 또한 중요한 요소입니다.
회사마다 조금씩 차이는 있지만 데이터 팀은 보통 3~4주 단위로 업무를 계획합니다. 처리 해야 하는 업무 우선순위를 기준으로 가급적 동일한 맥락으로 일일, 주간 업무를 하게 됩니다.
이렇게 계획된 업무를 기반으로 하루를 시작하며 가장 먼저 하는 일은 오늘 해야 할 일을 살피고 팀원이 모이는 데일리 스크럼 Daily Scrum에 참석하는 것입니다. 이 자리에서 오늘 진행하게 될 업무에 대해서 공유하는 시간을 갖고 협업 관계에 있는 팀원과도 소통합니다.
모든 구성원이 한 방향으로 일하기 위해 개인 업무를 팀에게 공유하는 시간입니다.
팀의 목표를 달성하기 위해 중요도가 낮은 업무의 우선순위를 조정하거나 불필요한 업무는 최소화하는 협의를 하게 됩니다. 이를 통해 협업하는 업무에 대해 발생할 수 있는 이슈를 최대한 사전에 인지하고 기한 내 업무를 마무리할 수 있습니다.
- 데일리 스크럼에서 필수로 공유해야 할 일 : 오늘 할 일, 팀원들의 협업이 필요한 일
이후에는 분석을 위한 데이터 수집 및 가공 작업과 수집된 데이터를 기반으로 분석을 하게 되며, 일정에 따라 각 부서에서 요청한 자료에 대한 리포트 준비, 알고리즘 프로토타입 제작 등의 작업을 하게 됩니다.
하루 중 가장 큰 비중을 차지하는 일은 커뮤니케이션 시간인데요. 각종 미팅에 참석하여 서비스 개선과 진행 중인 프로젝트에 대해 논의하게 되는 시간으로 이시간을 통해 추진하고 있는 업무를 좀 더 보완할 수 있는 시간으로 활용할 수 있습니다.
팀 외부 미팅에서는 도메인 지식이 있는 기획자로부터 모델 개발에 대한 아이디어를 얻을 수 있고 팀 내 동료들에게는 적합한 모델 선택과 방향성에 대한 피드백을 받는 시간이 되므로 미팅과 협력관계에 있는 동료들과의 소통을 통해 업무의 완성도를 높일 수 있게 됩니다.
코드스테이츠 AI 부트캠프 교육과정은 AI 개발 및 데이터 직군으로 취업을 희망하는 분들을 위해 기본적인 역량을 갖출 수 있도록 편성되어 있습니다. 수강생은 부트캠프를 통해 7개월간 9 to 6의 밀도 있는 학습과 프로젝트 과정을 거치며 빠른 성장을 통해 수료 시에는 커리어 초입에 들어서게 됩니다.
물론 AI 부트캠프의 수료만으로 AI, 인공지능, 데이터 분야의 모든 것을 마스터하기는 불가능합니다. 하지만 수강생이 데이터 커리어를 시작할 수 있도록, 수료 후 자기 주도적인 학습을 통해 계속해서 성장할 수 있도록 하는 환경이 AI 부트캠프 과정 내에 잘 갖추어져 있습니다.
바라는 모습의 데이터 직군, 데이터 사이언티스트가 되는 날까지 코드스테이츠 AI 부트캠프가 함께하겠습니다.
목록 보기
추천글