detail
- データサイエンス(Data Science:DS)は、データを軸として情報科学、統計などのアプローチから有益な知見やビジネス上の便益をもたらすよう働きかける学問です。 先端分野である機械学習や深層学習などのAI技術とも関連しており、学術的な研究や産業界での応用に注目が集まっています。
- データサイエンティストとは学術研究の世界だけでなく、ビジネスシーンにおいてもデータを活用した科学的な問題解決に取り組むのがデータサイエンティスト(データサイエンス人材)です。同じデータサイエンティストといってもプロジェクトでの役割やデータとの関わり方・扱い方によって、主に次の5つのタイプに分けられます。
- データアナリスト(分析者):データサイエンスを支える1つにデータアナリシスがあります。データアナリスト(分析者)は、統計解析の知見をもとにデータを分析し、ビジネス上の問題解決や意思決定をサポートします。SASやSPSSなどの統計ツールを利用したり、BI(ビジネスインテリジェンス)・BA(ビジネスアナリシス)のツール導入を支援したりすることもあります。
- データエンジニア(データ整備人):ビッグデータを利用するためのインフラ環境を整える役割がデータエンジニアです。データレイクやデータウェアハウスなどデータ基盤となるプラットフォームを導入し、データの収集・加工・活用の一連のパイプラインを処理します。サーバー環境にクラウドを利用する割合が増えており、AWSやGCP、Azureなどの知見が必要です。
- 機械学習エンジニア(開発者・技術者):ビッグデータの中から共通したパターンを発見するのに役立つのが機械学習。機械学習のライブラリやフレームワークを利用してシステムを実装したり、機械学習を組み込んだITシステムを構築・運用したりするのが機械学習エンジニアの主な仕事です。扱うデータにより、画像認識系のエンジニア(画像データ)と自然言語系のエンジニア(テキストデータ)などに分けることが可能です。
- コンサルタント(プランナー):データサイエンスの知見やAI活用の経験をもとに、ビジネスへの応用を考えたり、問題解決へ役立てたりするのはデータサイエンティストの大事な役目。データ収集や開発などの技術領域はエンジニアに任せ、有効な適用範囲を提案したり戦略を立案したりするのがプランナーやコンサルタントと呼ばれるビジネス職での役割です。
- データアーキテクト(モデラー):IT分野のモデラーは、業務の流れやシステム化の概念を形式的なモデルに落とし込みます。データを使用しやすく保管するためにガイドラインやテンプレートを使用して因果関係を図で表現します。データ管理者やデータエンジニアとも協業してデータマネジメントを実施します。