Q&A集
データサイエンス相談会
やメール等で、過去にいただいたご質問についてのQ&Aです。
ご質問は具体的な事についていただくことが多いですが、Q&A集では、一般的な表現に変えています。
データサイエンスの手法
抜き取り検査のデータから、歩留を推定できませんか?
受注予測をしたいのですが、受注データと気象データの関係は、どのようなモデルを使えば良いのですか?
平均相互情報量をPythonで実装するので、アルゴリズムを教えてください。
品質工学と実験計画法の違いは何ですか?
データ(N数)は、いくつ取れば良いのですか?
正規分布ではないのですが、どうすれば良いですか?
大量の文章があるのですが、要約を自動で作れませんか?
センサーデータの分析に、移動窓(窓関数)は使わないのですか?
原因の分析では、相関の強い変数を見つけるのですね?
Yが量的変数の時はT法で、質的変数の時はMT法を使えば良いのですか?
原因は、この変数ですか?
ばらつきを小さくするには、どうすれば良いですか?
このデータに、一番良いモデルは?
高次元(多変量)のモデルを作ることはありますか?
結果の方が前に起きることもあるから、仮説が間違いでは?
行と列を入れ替えれば、良いのでは?
時刻が等間隔ではない時は?
フーリエ変換で分析するのでしょうか?
データサイエンスのツール
よく使うツール(ソフト)は何ですか?
どのような手法(モデル)を実務で使いますか?
マシン(コンピュータ)はどのくらいのスペックが必要ですか?
勉強の仕方
どうやって参考文献を読んでいるのですか?
※
このページは2020年5月21日から作っています。
とりあえず思い出した範囲でまとめたものです。
過去のQ&Aは、思い出したり、記録が見つかれば、順次増やしています。