ビジネスパーソンのためのAI実践講座① ~AIの仕組みを知ろう~
自分はエンジニアではないから人工知能(AI)を使えない、もしくは自社はテクノロジー企業ではないからAIとは縁がない、などと思っていませんか。 本動画は、非エンジニアの方がプログラミング言語を使わずにAIを実際に使うための実践講座です。①「AIの仕組みを知ろう」では、そもそも人工知能(AI)とは何なのか、AIにはどのような種類があり、ビジネスに導入するとどんなことが可能なのかについて導入部分を学びます。 監修:森谷 和弘 データ解析設計事務所 代表、データアナリティクスラボ株式会社 取締役 CTO、データサイエンティスト協会 スキル定義委員 株式会社富士通金融システムズ(現 富士通株式会社)でデータベースエンジニアとしてのキャリアを積み、その後データ・フォアビジョン株式会社にてデータベースソリューションや金融工学系ソフトウェアの開発、データサイエンス、人事等の役員を担当。2018年よりフリーランスとして独立し、AIコンサルタント、機械学習エンジニア、データサイエンティスト、データアーキテクトとして活動。2019年、データアナリティクスラボ株式会社を共同経営者として起業し、データサイエンティストを未経験者から実践経験者へと育成する事業に従事。
会員限定
より理解を深め、他のユーザーとつながりましょう。
63人の振り返り
naoki_sasano
メーカー技術・研究・開発
データを扱ううえで正規化する必要があることはわかったが、0-1正規化の使いどころがわからなかった。全て標準化で処理すれば良いのではと思った。
3
kazumi_100pot
金融・不動産 関連職
0−1正規化と標準化の相違点を十分に理解していなかったので、今回の講座でしっかりと勉強できた。
2
user-name01
販売・サービス・事務
データの前処理として、データの欠損の補完、外れ値の扱い、正規化の方法があることを学んだ。
1
yutahayasaka
その他
素人には難しい。1回聴き流すだけでは理解できなかった。復習したい。
0
hi-std
IT・WEB・エンジニア
ラベルエンコーディングを使っていたが、数字の間に意味が発生するところまでは考えていなかった。
0
yukofunada
販売・サービス・事務
応用問題で分からなかった部分の理解が深まりました。
0
sakurai_shingo
人事・労務・法務
業務で活用できそう。
0
pinguino
販売・サービス・事務
前処理として必要なことが理解できた。
0
atsushi_komaki
金融・不動産 関連職
DS検定リテラシーレベル合格のために。
0
yokoishida
コンサルタント
ぼんやりしていた部分が、はっきりわかりました。
0
cs1960
販売・サービス・事務
大変、勉強になりました。
0
h-kozawa
メーカー技術・研究・開発
正規化と標準化について正しい理解ができました。併せて多様な前処理方法があることも理解できました。
0
i_mura888
金融・不動産 関連職
AIモデルを作る際のデータ前処理で役立つ。
0
test_test___
メーカー技術・研究・開発
データの前処理、特にデータの欠損をどう補完するかが勉強になった。
0
s-ma
経営・経営企画
前処理の手法と活用時の注意点を学んだ
0
michiyomichiyo
その他
外れ値に対しての考えが分かった
0
k_k_ai
メーカー技術・研究・開発
外れ値の処理の仕方が勉強になりました。
こういう考え方がある事を知ることで、データの見方がかわってきます。
0
taka1962
販売・サービス・事務
マニュアルでデータ処理するときは前処理を頭の中で知らぬ間にしていたことがわかりました。AIではとても重要だとわかりました。
0
tsukamotoya
営業
学習できたことを、業務や日常において活用していきます。
0
inyourmind
建設・土木 関連職
まだ素人なので、オートスケーリングはいつも面倒くさいと感じてしまいます。
0
e_co
販売・サービス・事務
データの前処理にも様々な方法があり、どれを採用するか正しい選択が必要だと感じました。
0
takumi_1453
経営・経営企画
欠損に対する処理
行を削除→欠損を含む行数が十分少ない場合
列を削除→特徴量があまり重要ではない場合
欠損を補完→各種平均、回帰モデル予測
スケーリング
データの尺度を合わせる、正規化
線形回帰やNNWでは実施が不可欠
0-1正規化
(データの値-最小値)/(最大値-最小値)
外れ値に影響されやすい
0-1の間にスケーリングしたい
標準化
(データの値-平均値)/標準偏差
0付近にスケーリングしたい
外れ値に対する処理
ウィンザー化
一定の範囲内に丸め込む
上位、下位それぞれ5%超過したものを
上位、下位5%の値に置き換える
IQR(interquantile range)で外れ値特定し行削除
第一四分位数-1.5iqr
第三四分位数+1.5iqr
iqr=第三四分位数-第一四分位数
箱ヒゲ図
最小値、第一四分位数、下側境界値
中央値
最大値、第三四分位数、上側境界値
質的データの変換
ワンホットエンコーディング
説明変数が多くなる
ラベルエンコーディング
数字の間に意味が生じて支障きたすことが多い
0
ta-mo-
IT・WEB・エンジニア
データにノイズがある場合、前処理は重要であり、その方法として、欠損、スケーリング、外れ値等の処理があることが分かった。
また、質的データはワンホットエンコーディング、ラベルエンコーディングがあるのは学びであった。
0
grateful
専門職
0-1正規化、標準化を学びました。
0
masato_86
専門職
わかりやすかったと思います。
0
shin_yako
販売・サービス・事務
参考になりました。実務の活用を考えます
0
70sp1208
その他
データの前処理は、統計の基礎が重要であることがわかった。統計の基礎を押さえて、AIについて理解を深めたい。
0
yoshikouc
販売・サービス・事務
実際に手を動かしながらしたいです
0
kyo1227
営業
データの前処理として、データの欠損の補完、外れ値の扱い、正規化の方法があることを学んだ。
0
hrkudo
IT・WEB・エンジニア
外れ値や質的変数の処理について理解できました。
0
takemaru0530
販売・サービス・事務
外れ値の考え方や扱い方は勉強になりました。
業務でも外れ値をどのように扱うかはその時のデータ集計の目的によって違います。ヒストグラムでは外れ値により形が変わるので、箱ひげ図を活用すればデータのばらつきや外れ値がわかります。業務でも箱ひげ図を活用できるようにしていきたいです。
0
aokitaka-tci
その他
データの前処理として正規化の必要性が理解できた、0−1正規化と標準化の相違点が一定理解できた
0
mutame
その他
データの前処理についても数式があることを学びました。
0
vz3000
IT・WEB・エンジニア
データの前処理について理解を深めることができた。スケーリングと質的データの量的変換の違いがよく分かった。
0
t_htn
経営・経営企画
データの前処理n考え方が把握できた。
データ分析を適切に行うためにも、
しっかりデータ前処理を行いたいと思う
0
k_yuna
販売・サービス・事務
大変勉強になりました。
0
watanabe-tat
専門職
質的データ、ダミー変数はワンホットエンコーディングを使う。ラベルリングデータは取り合う使いに注意する。
0
k-akira
営業
正規化と標準化の違いが理解できた
0
koichi_seya
その他
外れ値の処理などの手法が具体的に学べてよかった
0
stani
専門職
データを前処理して使いやすいものにし、長期に利用できるようにしたい。
0
chikako_k
IT・WEB・エンジニア
エラーになってしまう不要なデータは削除していましたが、削除にも手法があると知りました。
0
7031
経営・経営企画
データを扱ううえで正規化する必要があることはわかった。
0
mainichi365
IT・WEB・エンジニア
データを見直すこと。
0
matute
IT・WEB・エンジニア
データ分析を開始する前に外れ値の処理や正規化等を行い、正しいデータ分析ができるようにしたい
0
iso_ken
専門職
スケーリングと質的データの量的変換は参考になった
0
yasupii
その他
講義を聞いて、機械学習は使われるデータが重要であるので、その前準備が大切であると思いました。前準備について、知っておくべき基礎的なことが分かりました。どのようなモデルを作りたいのかで、使う手法が異なるので、実践する場合に留意していきたいです。
0
choko0504
メーカー技術・研究・開発
データ分析する際の基礎的な前処理について学ぶことができた。実務でいかすことがあればいかしたい 。
0
kenjiro_fujita
コンサルタント
すでにあるシステムのデータ定義書を見直して、今あるデータベースはワンホットエンコードなのか、ラベルエンコードなのか確認していきたい。
0
suzuqp
IT・WEB・エンジニア
データの前処理についても数式があることを学びました。
0
sesesese
その他
質的データの変換の説明はあってるのでしょうか?
S,M,Lの3つの区分があったら、作成する項目の数は2個ではないですか?
重回帰分析ではなくで、その他の機械学習の手法では、区分が3つの質的変数の場合、3つの変数を作成するのでしょうか?
0
ken222
営業
01正規化と標準化の手法をしっかり覚えるとともに、外れ値の扱いについてもしっかり覚えたい。
0
hfkd156036
金融・不動産 関連職
0−1正規化と標準化の相違点を理解できた
0
dense
メーカー技術・研究・開発
標準化もサンプル数が少ないと、外れ値の影響を受けます…
0
miura_ka
販売・サービス・事務
データの前処理の必要性と、前処理の種類を確認できたため取り入れたい。
0
512177
資材・購買・物流
データの前処理の必要性を学びました
0
ck27
その他
箱ひげ図などで具体的に外れ値をみながらデータを扱うことが学習できたので、活用していきたい
0
take515
メーカー技術・研究・開発
データ前処理の基本事項が確認できた。
0
hr-sakai
その他
0-1正規化と標準化の違が理解できた。外れ値の処理の方法も理解できたのでもっと学習してみます。
0
kk1000
販売・サービス・事務
ワンホットエンコーディングかラベルエンコーディングか、状況に応じて使い分けが必要だなと感じました。
0
shirojpn
メーカー技術・研究・開発
データの前処理として、欠損の処理方法、データの正規化、外れ値の処理方法、質的データの量的データへの変換時の注意点等を理解する事が出来た。
外れ値の処理方法としての、箱ひげ図の事例はわかりやすかった。
0
tsuyoshi_asano
経営・経営企画
無意識に自分がやっていたデータの処理方法がラベルエンコーディングであった。
質的データの処理(動画内の例でいえばTシャツの数量)ではワンホットエンコーディングの方が正確に判別できると理解した。一方、項目(例えばタスクやTODO)の優先度を重みづけする場合、ラベルエンコーディングでも良いだろうと思う。
0
vegitaberu
人事・労務・法務
データの前処理は実際に意識していることですが、スケーリングの考え方は、抜けていました。これを理解できたのが、一番の収穫でした。
0
madogiwazoku
その他
素人には難しすぎました。頭が痛いです。鼻血もでそうです。
0