データの可視化/データサイエンス入門
このシリーズでは、スキルアップAI株式会社の「データサイエンティスト基礎講座」より、ビジネスパーソンが知っておくべき内容を抜粋してお送りします。データサイエンティスト検定™ リテラシーレベルにも対応した内容となっています。 スキルアップAIは、入門、データ分析、AIエンジニア基礎、ビジネス、クラウド、AIエンジニア応用といったカテゴリで様々な講座を用意しています。 スキルアップAI株式会社 https://www.skillupai.com/open/
会員限定
より理解を深め、他のユーザーとつながりましょう。
91人の振り返り
kazumi_100pot
金融・不動産 関連職
記述統計学をグラフなどで可視化しながら学ぶことができました。しっかりと復習して行きたいと思います。
1
vz3000
IT・WEB・エンジニア
母集団や標本、相関など、記述統計学の基本的な知識を習得できた。今後の学習過程に活用していきたい。
1
yasupii
その他
母集団や標本、相関など、記述統計学の基本的な内容を理解できました。この内容をベースにさらに深い知識を学んでいきたいと思います。
1
h-kozawa
メーカー技術・研究・開発
基本的な統計基礎の復習になりました。
0
k_k_ai
メーカー技術・研究・開発
一部知らない内容も含まれていたので勉強になりました
0
pinguino
販売・サービス・事務
データを正しく解釈するために大変重要だと思うので、知識を身に付けたい。
0
tsukamotoya
営業
ありがとうございました。数学の噺もあり、思い出しながら学習致しました。業務活かせるよう努力致します。
0
t_yamags
メーカー技術・研究・開発
高校数学の授業の様であった。
中級なら、もう少し踏み込んでも良いのではないだろうか?
0
akku
マーケティング
内容が難しかったですが、改めて見直しをしようと思いました。
0
yoshiki2355
人事・労務・法務
データの前提は常に疑っていきたい
0
zyuroku
IT・WEB・エンジニア
中心やばらつきを見ることは、日々の仕事でも重要なので、活かしたい
0
moco_fuwa
その他
何度か復習し、身につけたい
0
yoyasu
人事・労務・法務
業務の時に活かすようにする。
0
cs1960
販売・サービス・事務
大変勉強になりました。
0
i_mura888
金融・不動産 関連職
統計の基礎なのでマスターしています。
0
atsushi_komaki
金融・不動産 関連職
相関は数値として関連性があるものが理解できるが、直感で感じた違和感も気にかけて、本当に相関があるかどうかを判断できるようになりたう。
0
inyourmind
建設・土木 関連職
相関関係があるからと言って因果関係があるとは言えないというのは興味深い。
0
naoyuki72
IT・WEB・エンジニア
まだ理解できない箇所が残っているため、再度動画を見て理解を深めたい
0
14001
資材・購買・物流
母集団や標本、平均値、中央値、最頻値の違いや、分散と標準偏差、相関関係と因果関係について学ぶ事が出来ました。数列や確率の復習にもなりました。
0
kabechi
専門職
いい復習になりました。
0
michiyomichiyo
その他
統計の基礎がこういうものだと知った
0
test_test___
メーカー技術・研究・開発
過去に学んだ内容の良い復習になった。
0
kitano_wataru
IT・WEB・エンジニア
データを分析する際は標準偏差や相関などが大事になってくるので、復習ができてよかった
0
tommy-april
販売・サービス・事務
本講座のおかげで、統計学が日常のさまざまな事象を分析することに大きく貢献していることや、好奇心を刺激する学問と感じました。
証券アナリスト試験にも活用できそうです。
0
staka3
その他
記述統計学で使われている用語など、少しは理解できた。
今後に役立てていきたいと思います。
0
acmon
メーカー技術・研究・開発
交絡という言葉を初めて知った。
データに相関があっても、そこに交絡要因が潜んでいないか注意する。
0
shu_higashi
専門職
データ解析は化学分野だけでなく、様々な領域で利用可能だと思うが、単に相関を見たり、有意差検定をするだけで良しとするのではなくなぜ相関が生じているのか、有意差が生じているのかをよく考察する必要がある
0
homma_nanami
販売・サービス・事務
記述統計学の基本的な内容を学びました。
0
koichirou_k
販売・サービス・事務
記述統計学について学ぶことができた。
標本の抽出方法、データの中心とばらつきの把握方法、変数間の関連の強さ、など学んだ内容を業務に活かしていきたい。
0
aokitaka-tci
その他
記述統計学の基礎を復習できた、相関≠因果の説明がわかりやすくてよかった
0
tasu-o
コンサルタント
記述統計学の中で、相関や偏差などそれぞれの意味合いを理解することができた。分析したい内容にあった方法を選択できるよう学習を進めていきたい
0
mutame
その他
偏差を確認しばらつきも見ていこうと思います。データの相関も疑似相関で確認してみます。
0
senna4521
営業
次のコンテンツを視聴していく
0
takumi_1453
経営・経営企画
全体的に何をするための技術で、どういう体系があって、という整理が明確なので途中脱落せずついていけました。そのうえで2点指摘します。
1つ Ⅳ章確率の解説が無い
2つ 相関係数、相関比、連関係数の解釈が人により異なるのは解せない←共通軸が無いからp値ハッキングのような恣意性が横行するのでは?という疑念
Ⅰ.記述統計学の基礎
・記述統計学と推測統計学
・母集団と標本
・調査方法とデータの抽出
・量的データと質的データ
Ⅱ.基本統計量
・平均値・中央値・最頻値
・範囲・分散・標準偏差
Ⅲ.2変数間の関連の強さ
・相関・因果・疑似相関・交絡
Ⅳ.確率
・確率の基礎
・条件付き確率、ベイズの定理
・代表的な確率分布
Ⅰ.記述統計学の基礎
・記述統計学と推測統計学
◆記述統計学はデータの正しい見方を与える
・騙されやすい例)
・H30年度調査で世帯別の平均年収は551.6万円
・中央値は423万円
・平均値以上年収がある人は38.6%のみ
◆統計学の2つの種類
・記述統計学:あるデータに対してその特徴を分かりやすく表現する
・推測統計学:得られたデータから調査したい母集団全体を推測する
・記述統計学の例)
・平均を計算
・可視化
・推測統計学の例)
・標本から母集団を推測する
・平均値の差に関する仮説検定を行う
◆母集団と標本
・母集団:データ全部
・標本(サンプル):実際に入手できるデータ
→母集団の調査は実質不可能であるため標本調査を行う
◆全数調査と標本調査
・全数調査:母集団全てのデータを取得
・標本調査:母集団から一部のデータを取得
・具体例)
・無作為抽出、層別抽出、多段抽出
Ⅱ.基本統計量
・データ全体の様子を知るために、データの中心を見つけ、その中心からの”値のバラつき具合”を調べる
◆◆データの中心を表す3つの方法
・平均値:データの平均
・中央値:データを小さい順に並べたときにちょうど中央に位置する数
・最頻値:最も度数の大きい値
◆平均値(ミーン)
・母平均
μ=Σxi/N N:母集団のサイズ
・標本平均
x=Σxi/n n=標本のサイズ
*平均値は外れ値に弱い
◆中央値(メディアン)
*偶数個のデータの場合、中央の2つのデータの平均が中央値
*外れ値に強い
*データ全体を考慮しない
◆最頻値(モード)
*決定的弱み:2つ以上の値を取る事があり得る
◆◆データのバラつきを表す指標
・範囲(レンジ)
・分散(バリアンス)
・標準偏差
◆範囲
・範囲=最大値ー最小値
*範囲が極端に大きい場合、外れ値の混入も考慮する必要がある
*平均値周りのバラつきを表すわけではない
◆分散
・データのバラつき・広がりを表す
◆標準偏差
・分散の平方根(√分散)
*分散の計算過程で2乗を行うから、√を取ると標準偏差と元のデータの単位を揃えることができる
◆分散の計算
・母分散
σ²=1/N・Σ(xi-μ)² *μ:母平均値
・母標準偏差
σ=√σ²
・標本分散
s²=1/n・Σ(xi-x)² *x:標本平均
・標本標準偏差
s=√s²
◆不偏分散
・標本しか得られない状況で母集団の様子を知りたい場合は、標本から推定する
・不偏分散は母分散の推定値として利用される
・不偏分散
(σ^)²=1/(n-1)・Σ(xi-x)²
・不偏標準偏差
σ^=√(σ^)²
*不偏分散を母分散の推定値として利用できる証明は『なるほど統計学 海鳴社 村上雅人』の3.4節を参照
◆分散の意味
①個々のデータから平均を引くと中心からのずれが分かる
②そのずれ(偏差)を全部足せばデータの中心からのバラつきがわかる
*そのまま足すとマイナス値がずれを打ち消してしまうので処理が必要
③2乗を取る
*絶対値は扱いが大変なので2乗のほうが便利
④平均を取ってバラつきの指標とする
Ⅲ.2変数間の関連の強さ
・データは「組」で与えられることがある
(x,y)=(60,70),(50,45),(10,12),(90,98)
例)(x,y)=(数学の点数,理科の点数)
(x,y)=(身長,体重)
◆◆2変数の関連の強さを評価する指標
・相関係数
・相関比
・連関係数
◆相関係数
・直線的な関係の強弱を示す
・-1〜1の値を取る
・係数の解釈 ★人により異なる
・0~±0.3:相関無し
・0.3~0.7、-0.3~-0.7:弱い相関あり
・0.7~1.0、-0.7~-1.0:強い相関あり
◆相関比
・量的変数と質的変数の関係性を測れる指標
・相関比の解釈 ★人により異なる
・0~0.1 :相関無し
・0.1~0.25 :相関あり
・0.25~1.0 :強い相関あり
例)売上個数✕東京vs大阪→相関無し
商品Aの売上個数✕東京vs大阪→相関あり
◆連関係数
・質的変数同士の関係性を測れる指標
・連関係数の解釈
・0~0.1 :連関無し
・0.1~0.25 :連関あり
・0.25~1.0 :強い連関あり
・例)
予備校AvsB✕大学合否
◆相関と因果
・相関✅️
一方が変化すれば他方も変化するような直線的な関係
・因果✅️
ある事実から他の事実が引き起こされる関係
・相関係数が高い≠因果関係がある
例)「学年」と「体重」・「学力」は正の相関関係にあるが、因果関係がある訳では無い☆☆☆
・因果関係が無い2つの項目の相関係数が高くなる事を疑似相関✅️と呼ぶ
・交絡✅️
疑似相関が発生している状態
・交絡要因✅️
2項目に影響を与えて相関係数を高くする第3の要因
例)学年(交絡要因)→学力
↓ ↑↑
体重←←←←←疑似相関
0
ryusho1118
経営・経営企画
母集団や標本、相関など、記述統計学の基本的な知識を取得できました。今後の業務の中で有効活用していきたい。
0
kesato
販売・サービス・事務
普段なんとなく使っていた偏差や相関について、改めて明確にすることが出来た
0
masato_86
専門職
母集団、相関など、統計学の基本的な知識が学習できた
0
hrkudo
IT・WEB・エンジニア
記述統計学の基礎は理解できました。
0
kyo1227
営業
母集団や標本、相関など、記述統計学の基本的な知識を習得できた。今後の学習過程に活用していきたい。
0
tono24
経営・経営企画
統計の基礎を学べた。資格取得の位置情報となった。
0
naomi0808703
マーケティング
分析業務で、統計的に優位性があるかを判断する基礎になりそう。
0
muraya_ma
IT・WEB・エンジニア
データの平均値やばらつき、変数の関連を表す指標について学ぶことができました。
分散や標準偏差値を計算して求めることは普段あまりないですが、商品を買うときに「大体〇〇円が基準値だな」「そこからどのくらい離れた価格だな」などと考える場面はあるなと思いました。
どの分析手法も強みや弱みがあるので、ケースに合わせてどんな手法を使えば良さそうか判断するのが重要なのかなと思いました。
0
yoshikouc
販売・サービス・事務
質的量的データに合うのは平均値をとるのか中央値なのか等、その時々のデータに合わせて手法を選ぶために様々なやり方がある事がわかりました。概論と実演を交互にやっていき徐々に精度があがっていきそうで、道のりが長いなと思いました。
0
f_a-835
IT・WEB・エンジニア
記述統計の基礎を理解でいたと思う。標準偏差と分散について、なぜ二乗を使用するのかなどわかりやすかった。
0
e_co
販売・サービス・事務
記述統計学の基礎を学ぶことができました。
実務のデータ分析を正しく行えるよう、理解を深めていきたい。
0
oknmkcti
経理・財務
新しい言葉が出てきた。初見なので、次から身に着けていきたい。
0
grateful
専門職
記述統計学を学びました。
0
hsooheos
人事・労務・法務
質的変数の関連性は連関で表す
0
yuka_ms
販売・サービス・事務
基本的な統計学の知識は勉強していたが、より実践的な活用の仕方を学べたたお思う
0
ka_saka
マーケティング
相関がわかりやすかったです。統計データを分析するためには思考し、指標算出するための考察、仮説立てといった重要性をあらためて理解した。
統計したデータをビジネスに転用する際のノウハウの大枠が再確認できました。
0
kenjiro_fujita
コンサルタント
データから偏差を求め、ばらつき具合について確認していきたい。また、データ同士の相関については疑似相関に気を付けてみていきたい。
0
70sp1208
その他
今回学んだ動画は初級でも学んだが、より詳しく解説があったことから理解が深まった。今回得た知識を実務に生かせるようにしていきたい。
0
ysen
IT・WEB・エンジニア
統計の基礎を学べた。資格取得の位置情報となった。
0
user-name01
販売・サービス・事務
業務において、統計的理論に基づいた数値の使い方ができるようにしたい。
0
matute
IT・WEB・エンジニア
記述統計の基礎知識を学ぶことができた。平均や中央値、最頻値など各種の指標からデータの全体像を正確に知る様心がけたいと思う
0
iso_ken
専門職
統計学は非常に重要
相関と因果は別物ということは注意深く分析しなければならない
0
choko0504
メーカー技術・研究・開発
記述統計学の基本的な相関や因果について理解することができた。今後、実務で利用する場面があったら活用したい。
0
napple0902
経理・財務
図をもとに説明があったのでわかりやすかったです
0
tys2025
メーカー技術・研究・開発
生産品のロット間の差異を検証する場合に相関係数や標本母数を使い検討することが有効であると思う。
平均値の検定、等分散性の検定と合わせて多角的に生産物を分析する上でも統計量は重要と考えている。
0
7031
経営・経営企画
データを十分に分析し、有効なアプローチを検討したいと思います。
0
hiroshi-srkr
経営・経営企画
記述統計学の入門という事で、それほど難しい内容ではありませんでしたが、良い復習になりました。
0
stani
専門職
統計学は面白いと思います。
0
naoki_sasano
メーカー技術・研究・開発
統計学基礎の復習ができた。二変数間の関連性については知識が乏しいのでさらに学習したい。
0
watanabe-tat
専門職
記述統計と推測統計を使いこなしたい。相関関係と因果関係、疑似相関に留意したい。
0
k-akira
営業
相関、相関比、連関係数の違いがわかった。ただし相関比の理解が不十分であった。
0
hararin-kobo
金融・不動産 関連職
記述統計学に関して、基礎のおさらいができました。
0
k_yuna
販売・サービス・事務
大変勉強になりました。
0
ichi_t
経営・経営企画
テキストでつまづいた部分は、高度な証明が必要で試験対策としては覚えるしかない部分だったことが分かった。
実践的に情報を整理されていてよかった。
0
t_htn
経営・経営企画
統計の基本的な考え方が把握できた。
この考え方を活用し、データを十分に分析し、
有効なアプローチを検討したいと思う
0
yume__
専門職
普段の業務のいろいろな部分を変数に置き換えることを意識してトレンドを予測するなど
0
ono_toshii
IT・WEB・エンジニア
疑似相関や相関関係がありそうでも因果関係がない場合があることに注意しなければならないと言うことが分かった。相関関係を調べる際には気を付けなければならないと思った。
0
suzuqp
IT・WEB・エンジニア
一つ一つの内容は今までにも学んだことがありましたが、記述統計学という言葉に含まれる内容であったことを知ることができました。母集団と標本が一致しているのか?と上司に確認されることがあるので、根拠をもって話せるようになりたい。
0
haruyukipapa
金融・不動産 関連職
不偏分散とは何か?悩んでいましたが、標本しかないときに母集団を推定する値だとようやく理解しました。また、相関比、連関係数、交絡についても理解が深まってよかったです。
0
madogiwazoku
その他
素人には難しいです。難しくてはげそうです。鼻血もでそうです。
0
minori_yabu
メーカー技術・研究・開発
統計学の基礎について理解することができた。
0
vegitaberu
人事・労務・法務
比較的、理解できている部分で、安心して進めることができました。これを、どのように、データサイエンスの実戦で応用していくか学ぶのが、楽しみですし、知りたいと思いました。
0
tsuyoshi_asano
経営・経営企画
SQLでデータを整理、線形モデルでインプットから予測値の算出、線形モデル内のパラメータを微分で精度向上、微分した結果を評価する際に記述統計を使う、という感じですかね。
0
t-kz
IT・WEB・エンジニア
記述統計学は、分かり易く基礎的な知識で活用できそうです。
0
9032843
経営・経営企画
統計基礎理解の確認ができた。
0
hr-sakai
その他
記述統計学を学ぶ事でデータからの誤った読み取りをしないように判断とする事ができる事が分かった。もっと学習して知識を学びたい。
0
s-ma
経営・経営企画
統計で使用される用語の意味を理解することが重要
0
shirojpn
メーカー技術・研究・開発
統計に関する基礎を復習する事が出来た。不偏分散の所は、以前学習した際に、頭に入らなかったが
今回の説明を聞いて、理解が深まった。
0
kiyohide-goto
販売・サービス・事務
記述統計について、すでに学習したことがある内容だったが、業務上頻繁につかうことがあるため、再確認できた。
0
miura_ka
販売・サービス・事務
基本的な内容の確認が行えた。
0
512177
資材・購買・物流
サンプリングで全体を推計できる。
0
hfkd156036
金融・不動産 関連職
記述統計学の基本的な内容を理解できた。
0
kammy-kammy
金融・不動産 関連職
学生時代以来、基礎数学に向き合っている。標本分散から不偏分散を用いて母分散を導く説明が非常にわかり易かった。現実では全体数の把握など到底難しく、不偏分散を活用することで統計学的に母分散を導きだせることを実務に転用できないか考えてみたい。
0
mai_i_t
金融・不動産 関連職
相関があるように見えても、そこに因果関係がない場合もあるので、交絡要因が潜んでいないかを踏まえて、データに向き合っていきたいと思いました。
0
yoshikazu-1103
営業
母集団・標本など文系出身の私でも理解しやすく講義いただけました。学びなおしを確実に実施して、自分の口で説明できるように学習します。
0
yoshihito_f
経営・経営企画
記述統計は、基本ですね。しっかりと身に着けます。
0
matsu1219
専門職
良い復習の機会となった
0