トップページ | Q&Aの一覧 | このサイトについて | ENGLISH

Q&A

Q(ご質問)

よく使うツール(ソフト)は何ですか?

A(ご回答)

Excelです。 もう少し詳しく言うと、Excelと、VBA(マクロ)を組み合わせて使うことが多いです。

社内で標準的に使うことになっている統計ソフト(Minitab、Statworks、JMPのようなもの)がある場合は、それも使います。 こういったソフトを使う時にも、Excelはデータの前処理のツールとして使います。

RやPythonは、時々使います。 使い分けですが、 Excelではできない統計分析をする時はRを使って、 Excelでは作業が大変なことになるグラフの作成やデータの処理は、Pythonを使う感じです。

なお、上記は2021年までの話です。 2021年に R-EDA1 ができてからは、まず、R-EDA1を使うようになって来ています。

補足

この質問は、よくいただきます。

質問する方は、「R か Python」と予想していることがほとんどで、回答を聞いて、微妙な表情になってしまわれることが多いです。 「RかPythonを使わなければ、データサイエンスはできない」と思っている方は、とても多いようですが、 何をやるかによります。

サイトの本文にも似たようなことを書いていますが、 筆者の場合は、Excelを一番使って来ています。 一番の理由としては、
「簡単な分析が、簡単にできる。すぐに結果が出せる。」、
「数万行くらいのデータなら速度が気になることがない」、
「t検定や相関係数など、よく使う統計手法は、関数で簡単に使える」、
「関数が豊富なので、プログラミングしなくてもかなりのデータ処理ができる」、
「必要な時は、VBAのプログラミングと組み合わせられる」、
「グラフがすぐに作れる」、
「データをいじるとグラフがすぐに変わるので、データの理解が早い」、
「1つのファイルに、データ、データ処理のプロセス、レポートの全部が入る」、
「他のソフトとは比較にならないほど普及しているので、様々な人と、分析プロセスや結果の共有が簡単。 他の人が同じようなことができるようになるのも簡単(社内で標準的に使うことになっている統計ソフトを使う理由もこれと同じです)」、
といった点があります。

ちなみに、Excelベースのデータ分析の本は、かなり出ていて、ビジネスの実務を想定した内容になっているものが多いです。 RやPythonをベースにしている本は、ビジネスの実務というより、データを使ったサービス業を想定したものが多い印象です。 このサイト の内容は、ビジネスの実務を中心にしつつも、RやPythonが必要な分野も入っている感じです。



Tweet データサイエンス教室