ビジネスパーソンのためのAI実践講座① ~AIの仕組みを知ろう~
自分はエンジニアではないから人工知能(AI)を使えない、もしくは自社はテクノロジー企業ではないからAIとは縁がない、などと思っていませんか。 本動画は、非エンジニアの方がプログラミング言語を使わずにAIを実際に使うための実践講座です。①「AIの仕組みを知ろう」では、そもそも人工知能(AI)とは何なのか、AIにはどのような種類があり、ビジネスに導入するとどんなことが可能なのかについて導入部分を学びます。 監修:森谷 和弘 データ解析設計事務所 代表、データアナリティクスラボ株式会社 取締役 CTO、データサイエンティスト協会 スキル定義委員 株式会社富士通金融システムズ(現 富士通株式会社)でデータベースエンジニアとしてのキャリアを積み、その後データ・フォアビジョン株式会社にてデータベースソリューションや金融工学系ソフトウェアの開発、データサイエンス、人事等の役員を担当。2018年よりフリーランスとして独立し、AIコンサルタント、機械学習エンジニア、データサイエンティスト、データアーキテクトとして活動。2019年、データアナリティクスラボ株式会社を共同経営者として起業し、データサイエンティストを未経験者から実践経験者へと育成する事業に従事。
会員限定
より理解を深め、他のユーザーとつながりましょう。
85人の振り返り
user-name01
販売・サービス・事務
推測統計学は確率を使って母集団を推測するものなので、結果には誤差があることに留意して活用したい。
2
tsukamotoya
営業
学んだことを業務に活かしますね。DXテストの前に学習しておけばよかったです。
1
vegitaberu
人事・労務・法務
内容は、しっかり理解できているかわかりませんが、データロボットのようなAI予測アプリケーションや重回帰分析などで、見られる数値の意味合いが理解できたと思います。これまでは、機械的に、P値は・・・、出現率は・・・などと、教えられたままに見ていましたが、少し、主体的に、扱うことができるようになるかもしれないな、そのきっかけにはなったかなと感じました。
1
hararin-kobo
金融・不動産 関連職
推定統計学の基礎が学べた。大切なことなので、しばらくしたら、もう一度復習します。
1
k-akira
営業
仮説検定のフロー、概念が理解できた
1
choko0504
メーカー技術・研究・開発
推測統計学は日常業務で利用することがないが、利用する機会があれば活用したい。
1
14001
資材・購買・物流
推測統計学、仮説検定、母集団、分散、標本の説明が分かりやすかったです。実際に多くのデータの予測は推測統計学から成り立っていることが多く、推測統計を正しく行うためにはサンプルを多くしたり片側検定などを利用したりすると良い事が分かりました。
0
h-kozawa
メーカー技術・研究・開発
検定基礎を改めて復習する機会となりました。
0
zyuroku
IT・WEB・エンジニア
よく有意な差があるないということを目にするが、その推定方法のロジックがわかった。
0
kaikai356
専門職
全二回のこの動画を視聴しただけでは、業務や日常において活用するのは非常に困難だと思う。いきなり登場する数式や用語(確率変数)などがかなりとっつきにくいのではないかと感じた。かなり多くの内容を削って概要を軽く説明しているだけの動画なので、なんとなーくわかった気になれるだけの動画だと思った。(中心極限定、点推定、信頼区間を十分に理解してからこの動画を見てようやく理解できると思う。)
0
yoshiki2355
人事・労務・法務
データを正しく理解して正しい判断をできるようにしたい
0
kiyama-h
IT・WEB・エンジニア
基礎理解に最適。
他の方も言うように、理解しづらい概念があり何度も見返す必要がある
0
moco_fuwa
その他
過去学んだ内容だが、学び直しができた。曖昧にしか覚えていなかったので、しっかり身につけたい
0
cs1960
販売・サービス・事務
大変勉強になりました。
0
ishii-toda
専門職
内容が難しく、理解まで達することができませんでした。
0
yuji64
経営・経営企画
ノートの書き込み方式がわかりやすかった。
0
masato_86
専門職
わかりやすかったです。
0
atsushi_komaki
金融・不動産 関連職
モノを調べるに当たって、全量調べるわけにはいかないが、サンプルを調べて仮説が正しいのか正しく無いのかを判断するのは難しい。だが、それを判断するに当たって、判断基準を設けてその目安についたよく分かった。
0
kitano_wataru
IT・WEB・エンジニア
内容が難しく、ついていけなくなってきているので、どこかの時点で復習する必要あり
0
test_test___
メーカー技術・研究・開発
この辺の内容は何度も確認して身につけていきたい
0
michiyomichiyo
その他
推定統計学がすこしわかった
0
ono_toshii
IT・WEB・エンジニア
仮設検証の意味がよく分かりました。ただ、現状で言うと業務のどこに応用していいのかよく分からないので、これからどのように応用できるかを検討していきたいと思います。
0
akira007
専門職
推測統計学での検定についておおよそのことが分かりました。実際に活用するには例を用いて演習を多くしないと身につかないと感じました。
0
k_k_ai
メーカー技術・研究・開発
普段統計量を扱う機会は少なく、あまり真面目に勉強してきませんでしたが、エンジニアとしては常識の話なのでしっかりと勉強していきたいです。
0
suzuqp
IT・WEB・エンジニア
現状の業務ですぐに活用できるものではないですが、将来的にデータサイエンスの知識は必要になりますので学習ができてよかったです。
また、専門用語が多い為、繰り返し確認する必要があると感じました。
0
kesato
販売・サービス・事務
推測統計学の基礎知識を取得できました。確立を用いた仮説の検証と注意点にも留意します
0
ichi_t
経営・経営企画
客観的に効果を測定する方法でも、サンプルサイズが妥当な規模を超えているかどうかは、客観的に判断する基準がなく、推計プロセスまで再鑑できないと結果のデータに対して評価できないように認識した。
0
homma_nanami
販売・サービス・事務
興味深かったです。視聴を繰り返し理解して活用できればと思いました。
0
aokitaka-tci
その他
推測統計学の基礎を学んだ、あくまで確率を用いて推測するものであることをあらためて留意したい
0
mutame
その他
仮説検定の概念が解りました。フローも再度見直しておきます。
0
temp_at
IT・WEB・エンジニア
検定は副作用の見方で馴染みはあったが、改めて意味を確認できた。
0
judoc_04
メーカー技術・研究・開発
QC検定2級の内容だったので、改めて見て曖昧だった箇所について理解が深まった。
p値や検出力のところを具体的に知りたかった。検出力0.8の妥当性がいまだに分かっていないが、論文等ではこれを標準とするとなっているため。なぜなのかが落とし込めていない。
0
takumi_1453
経営・経営企画
非常に難解で苦しい講義ですが、機械学習の随所に仮説検定の関連概念が出てくるので避けては通れない過程ですね(汗) p値ハッキングの話は統計初心者を大いに怖がらせる内容ですが、
☆☆☆p値ハッキングによる不正は、再現実験が困難である事で大抵発覚する
という事で一定の歯止めは掛かっているという理解で良いのかな?(汗)
検出力0.8(1-第1種の過誤)以上として帰無仮説を正しく棄却できるのはいいが、0.8以上にするためにどのようなアプローチまたは操作をするのかが分かりづらいので今後の確認事項とします。。
■推測統計学は入手したデータから母集団の様子を推測する技術
例)日本国内の中高生の平均身長を求める
→全数調査は困難
→日本各地から一定の標本を取り、そのデータを生成した確率分布を推定する事で真の値を推測する
■仮説検定により、母集団に関する仮説が成り立つかを判断できる
例)薬は本当に効いているかどうかを統計的仮説検定により検証する
■点推定と区間推定
◆正規母集団
・正規分布に従う母集団
◆母数
・母集団を決定するパラメータ
・正規母集団の母数はμ(母平均)とσ²(母分散)
◆母数が未知の場合、観測されたx₁/x₂/・・xnから母数を推定する
・母数の推定のために標本から求められる統計量を推定量と呼ぶ
例)標本平均、標本分散、標本標準偏差
・推定量を実際の数値として求めたものを推定値という
例)標本平均=1.234
■母数の推定方法
◆点推定
・母数をある1つの値で推定する
・例)
・母集団の平均値は、標本の平均値で点推定する
・母分散σ²は、不偏標本分散s²で点推定する
◆区間推定
・推定には誤差がある事を考慮し、母数が存在しうる値の範囲を推定する
・例)
・母集団の平均値が40~55の間に入る確率は68%である
《参考》標本誤差
・推定値と母数の値の差のこと
母集団→→標本→→調査
↓ ↓
母数の値←標本誤差→推定値
■統計的仮説検定
◆仮説検定☆☆☆
・標本を使い母集団に関する統計的な判断を下す方法
◆例)
・新しく開発された薬Aの薬効持続時間が従来の薬と比べて変化したかを調べたい
→10人の患者に対して臨床実験を行ったところ次のデータを得た
103.108.109.102.105.103.107.98.105.100
→これまでの経験から従来品の薬効持続時間は平均100、標準偏差6の正規分布に従う事が分かっている
→薬は改善されたと結論づけてよいか?
↓↓↓
・新薬Aに関する薬効持続時間の標本平均はx=104
・平均を比較すれば104>100のため薬は改善されたと言えるかもしれない
→しかし、
・本当に新薬Aの効果としてこのような結果が得られたのか?
・他の患者に対しても同様な結果を得られるのか?
↓↓↓
・感覚に頼らない客観的な基準に基づいた判断が必要⇒統計的仮説検定の技術
■統計的仮説検定の手順
①仮説の設定
②検定統計量の設定
③有意水準の決定
④仮説の検証
*検定の種類はたくさんあるが、手順は同じ
①仮説の設定
◆新薬Aの例で立てられる仮説
・仮説H₀:新薬Aの薬効持続時間の母平均μは100 のまま H₀:μ=100
・仮説H₁:新薬Aの薬効持続時間の母平均μは100ではない H₁:μ≠100
◆H₀を帰無仮説、H₁を対立仮説と呼ぶ
・帰無仮説:差がないという仮説
・対立仮説:差があるという仮説
◆帰無仮説を否定する事を棄却、
帰無仮説を支持する事を採択、という
◆対立仮説のパターン
1.H₀:μ=100 vs H₁:μ≠100
2.H₀:μ=100 vs H₁:μ>100
3.H₀:μ=100 vs H₁:μ<100
◆1を両側検定、2・3を片側検定と呼ぶ
《参考》
・検定を行う際に分析者が持っている情報に応じて、両側検定を行うか片側検定を行うかを決める
②検定統計量の設定
◆仮説を検証する際に見る指標の事
◆新薬Aの母平均μが100よりも大きい
→標本平均xも100より大きい値のはず
→x-μを見れば以下が分かるはず
・帰無仮説が正しい→x-μは0に近い
・帰無仮説が正しくない→x-μは0に近くない
◆x-μの値で仮説検証したい
→xはサンプル次第で変わる
→単にx-μを見るだけだと偶然大きな値を取ったサンプルに騙されそう
→xは確率変数のため、x-μも確率変数
→x-μそのものでなく「x-μの確率」を見て差があるかを判別する
→x-μの確率が「しきい値」より小さければ帰無仮説を棄却する
◆x-μを含む指標Z=(x-μ)÷(σ/√n)は平均0、分散1の正規分布N(0,1)に従う
・Zは標準化した標本平均
・σは母分散、nはサンプルサイズ
・平均0、分散1の正規分布N(0,1)は標準正規分布と呼ばれる
・N(0,1)に従うので積分計算や標準正規分布表で確率を算出可能
・Zを母平均μの検定に用いる検定統計量(test statistic)と呼ぶ
③有意水準の決定
◆帰無仮説を棄却するために用いる確率のしきい値を設定する
・Zの値が95%の確率でZが含まれると考えられる区間よりも外側にあれば、x-μは有意な差であるとみなす
→Zが5%の確率でしか発生しないのでx-μは無視できない大きさと考え、帰無仮説を棄却する
◆稀な領域を決める確率値を有意水準αと呼ぶ
・αは0.01や0.05とする
・有意水準は帰無仮説棄却のボーダーライン
◆棄却域をR、採択域をR^cとしたとき、
・P(Z∈R)=α
・P(Z∈R^c)=1-α
*どの値以上・以下なら棄却域になるかは分布表を見れば分かる
◆仮説検定では検定統計量が滅多に起きない領域に入った場合に帰無仮説を棄却する、という考え方をとる
④仮説の検証
◆有意水準5%における両側検定の棄却域Rは標準正規分布の下側2.5%点以下&上側2.5%点以上
・標準正規分布表を用いると-1.96以下または1.96以上の値が棄却域となる
・新薬Aの例にある値
・標本平均:x=104
・母標準偏差:σ=6
・母平均:μ=100
・サンプルサイズ:n=10
→√10≒3.16
を検定統計量Zに代入するとZ≒2.11
↓↓↓
棄却域に入っているため有意水準5%のもとで帰無仮説は棄却される★★★
◆帰無仮説が棄却されない場合の解釈
・帰無仮説が正しい、のではなく
帰無仮説を棄却するための証拠が不十分、と考える
・検定統計量Z=√n(x-μ)/σはサンプルサイズnが大きくなれば値が大きくなる
→帰無仮説が棄却されないのは単にサンプルサイズが足りないだけの可能性がある
◆帰無仮説を棄却するかのもう一つの判断尺度p値
・片側検定:帰無仮説の元で検定量がその値以上/以下となる確率
・両側検定:片側検定におけるp値を2倍したもの
・p値<有意水準なら帰無仮説を棄却する
参考)
・p値に関する誤用が多いためASA(米国統計学会)から声明が出された
・自身の仮説の正当性を主張するために検定されたデータや実験設定を恣意的に決める「p値ハッキング」は絶対にしない事
◆従来の検定の考え方
・帰無仮説が正しいと仮定し、滅多に起きないことが起きたら(棄却域に検定統計量が入ったら)帰無仮説を棄却する
→滅多に起きないことは稀に起きてしまう
・仮説検定における間違いは以下の2パターンが考えられる
第1種の過誤:帰無仮説が正しいのに、帰無仮説を棄却した
第2種の過誤:対立仮説が正しいのに、帰無仮説を採択した
↓↓↓
表すものが異なるので2つの過誤を同時に小さくすることは不可能
(代表的な検定統計量は第2種の過誤を小さくするよう設計されていることが多い)
★(1-第2種の過誤の確率)を検出力といい、0.8以上が望ましいとされる
・検出力:対立仮説が真であるときに帰無仮説を棄却する確率
・検出力0.8の解釈:サンプル取得と仮説検定を繰り返したとき、80%の確率で正しく帰無仮説を棄却できる
帰無仮説を 帰無仮説を
棄却しない 棄却する
帰無仮説が真 正しい判定 第1種の過誤
対立仮説が真 第2種の過誤 正しい判定
0
ryusho1118
経営・経営企画
推計統計学の基礎的な部分は理解できた。復習して実業務にどのくらい適用できるか検討したい。
0
ikenori
メーカー技術・研究・開発
過去に勉強したことがあったが、学び直すことができてよかった。多く忘れてしまっていることにも気がついた。
0
pinguino
販売・サービス・事務
どのように、統計的判断を下すのかがわかり、大変興味深く、活用したいと思った。
0
hrkudo
IT・WEB・エンジニア
検定について大枠理解しました。
0
kanedat
人事・労務・法務
推測するケースは多いので、きちんと理解して業務に取り入れる。
0
kyo1227
営業
推定統計学の基礎が学べた。大切なことなので、しばらくしたら、もう一度復習します。
0
makotokoma
販売・サービス・事務
ありがとうございました。
0
yoshikouc
販売・サービス・事務
何度か視聴して実際の仕事のイメージができたらいいです
0
e_co
販売・サービス・事務
仮説検証は業務に使えそうなので、しっかり理解を深めたいと思います。
0
shin_yako
販売・サービス・事務
参考になりました。仕事での活用を考えます
0
koichirou_k
販売・サービス・事務
推測統計学により入手したデータから母集団を推定する方法を学んだ。
復習して理解を深めたい。
0
grateful
専門職
推測統計学を学びました。
0
yuri_sudo2
その他
統計がちょい学べた。
0
ken222
営業
経営戦略策定にあたって、データに基づいた説得力のある意思決定を行うために活かすことができそう。
0
kenjiro_fujita
コンサルタント
仮説検証のやり方が具体的に理解できた。お客様がサービスを購入する確率などに応用していきたい。
0
inyourmind
建設・土木 関連職
統計的検定仮説はいつも使おう使おうと思いつつ、使いどころがないのが難しいところです。
0
matsuiha
営業
p値は客先とのデータ分析資料上でも登場したので気になっていたが、完全には理解できなかった。細かい計算方法などは統計学をきちんと勉強しないことには習得は難しいと感じた。
0
yasupii
その他
推定統計学、専門的な用語がたくさん出てきました。一度勉強をしたことがあるので、よい復習になりました。
0
iso_ken
専門職
業務において推定と仮説検証をしっかりやることで、判断の品質を上げていきたい。
0
matute
IT・WEB・エンジニア
母集団の全数調査ができない場合、どの様に統計的に正しらしさを証明するか学ぶことができた、実際に起こった事象も仮説検定を使ってまれに起こりうるものなのか、そうでないのか、統計的に推測できるように実践を積み上げていきたい
0
dense
メーカー技術・研究・開発
帰無仮説を破棄することと採択することは、違うような気がする
仮説検定法では、仮説を採択するようなことを、行わないはず
0
hm-1126
その他
点推定、区間推定が理解できた。仮説検定は業務の中でも活用できると思う。
0
yuka_ms
販売・サービス・事務
推定については理解できたが、仮説検定にはなじみがうすく、実用的な場面が思い浮かばなかった。
0
7031
経営・経営企画
仮説検定のフロー・概念が大変よく学べました。
0
stani
専門職
推測に必要な考え方を学んだ。
0
70sp1208
その他
推測統計学は、品質管理の講習で出てくるが、AIの分野でも活用されているとは知らなかった。どのような場面で活用されているか、具体例を知りたくなったので、詳細を学習してみたい。
0
naoki_sasano
メーカー技術・研究・開発
改善効果を確認する際は、前後の統計量の変化の比較しかしていなかった。仮説検定することで本当に効果があったのか検証する必要があることを学んだ。
0
watanabe-tat
専門職
帰無仮説の統計検定量を求めP値を使い有意水準外であり、対立仮説を支持する検定をおこないたい。
0
koichi_seya
その他
データを使う人間にとっては全員が把握しておくべき内容
0
k_yuna
販売・サービス・事務
少し難しいと感じました。
0
t_htn
経営・経営企画
可視化により相手への理解が深まるだけでなく、
誤解も与えることが事例から把握できた。
帰無仮説などしっかり仮説立てて検討したいと
思う。
0
kazumi_100pot
金融・不動産 関連職
帰無仮説と対立仮説を用いた統計検定を実務で利用してみたいです。
0
miura_ka
販売・サービス・事務
業務によりサンプルの大小があり捉え方が難しい場面があるが、仕組みを確認する事で今後の方針策定等に役立てられると感じた。
0
mya_shi
その他
学び直しができ,自分の曖昧に理解している部分を知ることができた。
0
minori_yabu
メーカー技術・研究・開発
正規分布および帰無仮説に関して久しぶりに学ぶ事ができた。
0
bobby2490
IT・WEB・エンジニア
基礎知識をしっかり身につけることが、その先の応用や実践で重要だと感じるので、少しでも解らない部分は何度でも復習して身につけたい。
0
ni-shi-me
営業
DS検定で学習した内容の復習が出来た。
0
shirojpn
メーカー技術・研究・開発
今回の内容は、品質検定を受験する際に、何回も練習問題を解き習得した内容でした。
ただ、やはり忘れてしまっている事を多いと感じた。
しっかりと、身につくようにしたい。
0
hr-sakai
その他
統計学が少しわかった。もう一度学習して自分のものにしたいです。
0
akku
マーケティング
現状の業務ですぐに活用できるものではないですが、将来的にデータサイエンスの知識は必要になりますので学習ができてよかったです。
また、専門用語が多い為、繰り返し確認する必要があると感じました。
0
take515
メーカー技術・研究・開発
仮説検定の基本的な考え方を確認できた。
0
512177
資材・購買・物流
推計統計学を用いて事業運営に貢献していく
0
madogiwazoku
その他
素人には難しいです。難しくてはげそうです。鼻血もでそうです。
0
yoshikazu-1103
営業
統計学の基礎を学ぶことができました。まだ、理解し活用できるまでには至っていません。日々学習する必要を感じます。
0
hfkd156036
金融・不動産 関連職
推定統計学の基礎が学べた
0
k--g--
その他
全数調査が出来ればいいのですが、それができないからこそ検定の考え方が必要になるのですね。
0
boo10109
メーカー技術・研究・開発
母集団をサンプルで推し量る手段として有効ではあるが、推定の誤差が必ず存在することを注意したいと思った。
0
vz3000
IT・WEB・エンジニア
推定統計学の基礎について理解を深めることができた。
0
moro_47
金融・不動産 関連職
推定統計学の基礎が学ぶことができ、よかった。何気ない分析もそういったことが根底にあると思うので、復習しながら活用したい。
0
fgl970101
資材・購買・物流
統計検定2級の知識が求められますね。勉強になりました。
0
yoshihito_f
経営・経営企画
推計統計学の復習に役立った。
0
shinjitsu
資材・購買・物流
社内の業務改善の効果確認において、仮説をたてて一部のデータをもとに検証してみたい。
0