데이터 사이언티스트 역량ㅣ하드 스킬, 프로그램 언어 및 도구

인사이트

데이터 사이언티스트 역량ㅣ하드 스킬, 프로그램 언어 및 도구

2022년 07월 04일

데이터 분석 관련 직무 중 하나인 데이터 사이언티스트 직무는 데이터 사이언스를 통해 인간의 삶의 질을 향상하는 사람입니다. 현업의 알고리즘 기술 및 시스템 성능 향상과 비즈니스 인사이트 도출까지 전 영역에서 활동하는 제너럴리스트라고 할 수 있죠.

지난 데이터 사이언티스트가 하는 일 포스팅에 이어 오늘은 데이터 사이언티스트가 되기 위해 필요한 역량에 대해 알려드리려고 해요. 데이터 사이언티스트 역량에 어떤 것들이 포함되는지 같이 살펴볼까요?


데이터 사이언티스트 (Data Scientist)
되기 위해 필요한 역량은? 👨‍🔬

다양한 역량이 필요한 데이터 사이언티스트

데이터 사이언티스트는 데이터를 활용해 사람들의 삶을 편하게 하는 직무로 설명되는 만큼 기업마다, 비즈니스마다 업무 범위 또한 넓은 편입니다. 소속된 기업에 산재한 데이터를 수집하여 분석하고, 비즈니스에 잘 활용할 수 있도록 인사이트를 찾기도 합니다.

기본적으로는 딥러닝(DL, Deep Learning), 머신러닝(ML, Machine Learning) 분야에 대한 지식, 데이터 분석을 위한 통계 및 수학적 지식, 데이터 전처리 및 모델링을 위한 코딩 능력, 해당 분야에 대한 비즈니스 도메인 지식 등이 요구됩니다. 또한 데이터 업무 특성상 기획자, 개발자, 마케터 등 타 부서와 긴밀한 커뮤니케이션도 필요하죠.

데이터 사이언티스트 역량

데이터 사이언티스트 직무에 필요한
하드 스킬 & 소프트 스킬

하드 스킬이란 업무를 수행하기 필요한 기술적인 역량에 해당합니다. 지속적인 학습과 훈련을 통해 개발하고 향상할 수 있는 스킬이죠. 소프트 스킬이란 사람들과 함께 일하고 의사소통하는 방식을 가리키는 스킬입니다. 성공적인 팀워크로 이끄는 책임감이나 꼼꼼함, 원활한 커뮤니케이션 스킬 등이 이에 해당합니다.

데이터 사이언티스트 하드 스킬 🛠

  • 수학 / 통계학에서 연구된 핵심 개념 적용(어느 과정에 사용할 수 있는지) 능력
  • 데이터와 업무 성격에 따라 파라미터 조정, 신경망 구조 변경 등에 오버헤드를 줄이는 감각
  • 적절한 모델 선택과 때에 따라 이를 변형 및 재구성할 수 있는 능력

데이터 사이언티스트 소프트 스킬 및 기타 역량 💘

  • 문제 정의 및 인식을 통한 비즈니스 인사이트 도출
  • 소속 기업의 도메인 지식
  • 커뮤니케이션 능력
  • 학습 능력
  • 지적 호기심
데이터 사이언티스트 역량

특히 중요한 역량은? 학습 능력과 호기심

데이터라는 원석을 다듬어 보석으로 만드는 데이터 사이언티스트 💎

이 중에서도 특히 중요한 역량을 꼽는다면 학습 능력과 호기심입니다. 위에서 언급한 하드 스킬과 소프트 스킬 모두 평균 이상의 능력이 있다고 하더라도 현재에 안주하는 성향이라면 데이터 사이언티스트 직무가 되기에 적합하지 않습니다. 꾸준한 학습을 통해 직무 전문성을 확장해 나갈 수 있는 분이야말로 데이터 사이언티스트가 되기에 좋은 역량을 가졌다고 할 수 있습니다.

현업에서 데이터 사이언티스트가 처음 접하게 되는 데이터는 원석과 같습니다. 처음에는 돌처럼 보이지만 여러 과정을 통해 불순물을 제거해 나가면 사람들이 선호하는 아름다운 보석이 될 수 있습니다. 데이터 사이언티스트의 끊임없는 호기심은 여러 데이터 사이에서 일정한 패턴을 파악하여 다른 사람들이 발견하지 못한 숨겨진 내용을 인사이트로 도출할 수 있는 실마리를 제공합니다.

데이터 사이언티스트 커리어
어떻게 준비해야 할까요?

데이터 사이언티스트가 되기 위해서는 자신이 흥미를 느끼는 분야를 선정하고 해당 분야에서 어떠한 문제를 해결하고 싶은지에 대한 고민이 필요합니다.

데이터 사이언티스트 비즈니스 예시

  • 이커머스 기업 : 경쟁사 프로모션, 날씨 등의 외부요인을 고려한 적정량 발주(신선식품), 출고량 예측
  • 교육 기업 : 수강생의 학습 상황(점수, 수업참여도 등)에 따라 적절한 코칭(이탈률 최소화, 재구매 유도)
  • 모빌리티 기업 : 시간대별 수요 예측을 통한 차량 배치 최적화(한정된 차량으로 효율적인 운영)

자신이 풀고자 하는 문제가 정해졌다면 모든 분야의 역량을 키우는 것보다 본인이 정한 특정 도메인에서 필요로 하는 스킬과 업무 성향에 맞춰서 준비하는 것이 좋습니다.

데이터를 해석하여 인사이트를 도출하는 것에 흥미가 있다면(분석가 성향) 머신러닝, 딥러닝, 수학적 지식을 바탕으로 컴퓨터 사이언스와 빅 데이터 플랫폼에 대해 집중하는 것을 추천드리며, 문제를 해결하기 위해 솔루션을 직접 만드는 것에 흥미가 있는 분이라면(개발자 성향) 머신러닝, 딥러닝 등에 필요한 데이터 엔지니어링을 중심으로 통계학, 기계 학습, 강화 학습에 대한 역량을 개발하는 것이 좋습니다.

이 외에 프로그램 언어/도구는 python/R/Scala, scikit-learn/spark, Tensorflow/pytorch 등 하나 이상을 능숙하게 다룰 수 있어야 하며, 빅데이터 분석과 관련된 Hadoop, Hive, Spark 등을 사용할 수 있는 것도 도움이 되겠습니다.

데이터 사이언티스트 역량

데이터 사이언티스트 취업 TIP

식자재 유통 분야 스타트업 데이터 사이언티스트 박주윤님 인터뷰 🎙

Q. 데이터 사이언티스트 취업을 준비할 때 어떤 것들이 가장 도움이 되었나요?

저는 학사와 석사 때 진행했던 데이터 분석 프로젝트를 활용해 이력서와 포트폴리오를 작성했는데요. 면접을 볼 때도 이와 관련된 질문들이 자주 나왔어요. 코드스테이츠 AI 부트캠프에서 진행한 프로젝트, 시각화 공모전 질문도 자주 나왔고요. 수료 이후부터 지금까지 머신러닝 및 딥러닝 관련 알럼나이 챌린지를 운영하고 있는데 열의를 좋게 봐주신 것 같아요.

데이터 사이언티스트
코드스테이츠 AI 부트캠프 2기 수료생 박주윤님

Q. 코드스테이츠 AI 부트캠프 수료 전과 수료 후의 나는 어떻게 달라졌나요?

이전에는 통계학적 지식만 알고 있었어요. 대학에서는 정제된 데이터를 지식 습득 목적으로만 배웠기 때문에 실제 산업에서 어떻게 쓰이는지 전혀 몰랐죠.

AI 부트캠프를 수강하면서 현업에서 쓰는 툴, 기본적인 컴퓨터 세팅, 데이터 수집, 프로젝트 기획과 같이 대학에서는 얻을 수 없던 것을 얻었습니다.

현재 직장에서 저는 문제 상황 파악, 프로젝트 기획부터 데이터 수집, 리서치 작업, 기술 구현과 배포까지 데이터 사이언티스트 업무 end-to-end를 담당하고 있는데요. AI 부트캠프에서 쌓은 경험으로 전체적인 데이터 사이언티스트 업무 플로우를 이해할 수 있는 게 신기했어요. 개발자, PM과 막힘없이 커뮤니케이션을 할 수 있다는 점도요.

데이터 사이언티스트 커리어의 시작
코드스테이츠 AI 부트캠프

위에서 소개한 박주윤 님은 코드스테이츠 AI 부트캠프 2기 수료생으로 부트캠프 수료 후 원하던 데이터 사이언티스트 직무 취업에 성공했습니다. 코드스테이츠 AI 부트캠프에서는 AI 개발 및 데이터 직군으로 취업을 희망하는 분들이 기본 역량을 갖출 수 있는 교육 커리큘럼을 제공하고 있습니다.

AI 부트캠프에서 7개월간의 밀도 있는 학습, 각종 프로젝트 수행을 통해 빠르게 성장한 많은 수료생이 현재 고려대학교 안암병원, LG CNS, 카카오스타일, 현대카드, 두나무 등 다양한 기업에서 데이터 관련 포지션으로 일하고 있습니다.

데이터 사이언티스트 커리어를 꿈꾼다면 코드스테이츠 AI 부트캠프에서 기본적인 데이터 역량부터 차근차근 키워보시면 어떨까요? 나이, 성별, 전공 유무에 상관없이 학습 능력과 호기심 넘치는 많은 예비 데이터 사이언티스트 분들의 탑승을 기다리고 있어요!


👨‍🚀 데이터 사이언스 커리어의 시작,
AI 부트캠프가 더 궁금하다면?

목록 보기

추천글