キャンペーン終了まで

割引情報をチェック!

すべての動画をフルで見よう!

初回登録なら7日間無料! いつでも解約OK

いますぐ無料体験へ

機械学習⑥データの前処理/データサイエンス入門

  • 0h 14m (1sections)
  • テクノベート (テクノロジーとイノベーション)
  • 実践知

このコースについて

このシリーズでは、スキルアップAI株式会社の「データサイエンティスト基礎講座」より、ビジネスパーソンが知っておくべき内容を抜粋してお送りします。データサイエンティスト検定™ リテラシーレベルにも対応した内容となっています。

スキルアップAIは、入門、データ分析、AIエンジニア基礎、ビジネス、クラウド、AIエンジニア応用といったカテゴリで様々な講座を用意しています。

スキルアップAI株式会社
https://www.skillupai.com/open/

コース内容

  • 機械学習データの前処理

より理解を深め、他のユーザーとつながりましょう。

61人の振り返り

  • naoki_sasano

    メーカー技術・研究・開発

    データを扱ううえで正規化する必要があることはわかったが、0-1正規化の使いどころがわからなかった。全て標準化で処理すれば良いのではと思った。

    2023-10-13
  • kazumi_100pot

    金融・不動産 関連職

    0−1正規化と標準化の相違点を十分に理解していなかったので、今回の講座でしっかりと勉強できた。

    2023-08-16
  • user-name01

    販売・サービス・事務

    データの前処理として、データの欠損の補完、外れ値の扱い、正規化の方法があることを学んだ。

    2023-12-03
  • madogiwazoku

    その他

    素人には難しすぎました。頭が痛いです。鼻血もでそうです。

    2024-05-11
  • hi-std

    IT・WEB・エンジニア

    ラベルエンコーディングを使っていたが、数字の間に意味が発生するところまでは考えていなかった。

    2024-08-19
  • tsuyoshi_asano

    経営・経営企画

    無意識に自分がやっていたデータの処理方法がラベルエンコーディングであった。
    質的データの処理(動画内の例でいえばTシャツの数量)ではワンホットエンコーディングの方が正確に判別できると理解した。一方、項目(例えばタスクやTODO)の優先度を重みづけする場合、ラベルエンコーディングでも良いだろうと思う。

    2024-04-29
  • suzuqp

    IT・WEB・エンジニア

    データの前処理についても数式があることを学びました。

    2024-05-21
  • k_yuna

    販売・サービス・事務

    大変勉強になりました。

    2023-09-28
  • masato_86

    専門職

    わかりやすかったと思います。

    2024-10-02
  • michiyomichiyo

    その他

    外れ値に対しての考えが分かった

    2024-06-03
  • s-ma

    経営・経営企画

    前処理の手法と活用時の注意点を学んだ

    2024-06-04
  • iso_ken

    専門職

    スケーリングと質的データの量的変換は参考になった

    2023-12-13
  • mainichi365

    IT・WEB・エンジニア

    データを見直すこと。

    2023-11-21
  • i_mura888

    金融・不動産 関連職

    AIモデルを作る際のデータ前処理で役立つ。

    2024-06-22
  • takumi_1453

    経営・経営企画

    欠損に対する処理
     行を削除→欠損を含む行数が十分少ない場合
     列を削除→特徴量があまり重要ではない場合
     欠損を補完→各種平均、回帰モデル予測

    スケーリング
     データの尺度を合わせる、正規化
     線形回帰やNNWでは実施が不可欠
     0-1正規化
      (データの値-最小値)/(最大値-最小値)
      外れ値に影響されやすい
      0-1の間にスケーリングしたい
     標準化
      (データの値-平均値)/標準偏差
      0付近にスケーリングしたい

    外れ値に対する処理
     ウィンザー化
      一定の範囲内に丸め込む
      上位、下位それぞれ5%超過したものを
      上位、下位5%の値に置き換える
     IQR(interquantile range)で外れ値特定し行削除
      第一四分位数-1.5iqr
      第三四分位数+1.5iqr
      iqr=第三四分位数-第一四分位数
      箱ヒゲ図
       最小値、第一四分位数、下側境界値
       中央値
       最大値、第三四分位数、上側境界値

    質的データの変換
     ワンホットエンコーディング
      説明変数が多くなる
     ラベルエンコーディング
      数字の間に意味が生じて支障きたすことが多い

    2024-09-26
  • h-kozawa

    メーカー技術・研究・開発

    正規化と標準化について正しい理解ができました。併せて多様な前処理方法があることも理解できました。

    2024-09-14
  • grateful

    専門職

    0-1正規化、標準化を学びました。

    2024-10-02
  • shirojpn

    メーカー技術・研究・開発

    データの前処理として、欠損の処理方法、データの正規化、外れ値の処理方法、質的データの量的データへの変換時の注意点等を理解する事が出来た。
    外れ値の処理方法としての、箱ひげ図の事例はわかりやすかった。

    2024-04-08
  • sakurai_shingo

    人事・労務・法務

    業務で活用できそう。

    2024-08-12
  • atsushi_komaki

    金融・不動産 関連職

    DS検定リテラシーレベル合格のために。

    2024-08-03
  • k-akira

    営業

    正規化と標準化の違いが理解できた

    2023-10-15
  • 70sp1208

    その他

    データの前処理は、統計の基礎が重要であることがわかった。統計の基礎を押さえて、AIについて理解を深めたい。

    2024-10-09
  • kyo1227

    営業

    データの前処理として、データの欠損の補完、外れ値の扱い、正規化の方法があることを学んだ。

    2024-11-10
  • e_co

    販売・サービス・事務

    データの前処理にも様々な方法があり、どれを採用するか正しい選択が必要だと感じました。

    2024-09-25
  • inyourmind

    建設・土木 関連職

    まだ素人なので、オートスケーリングはいつも面倒くさいと感じてしまいます。

    2024-05-06
  • hr-sakai

    その他

    0-1正規化と標準化の違が理解できた。外れ値の処理の方法も理解できたのでもっと学習してみます。

    2024-03-30
  • yoshikouc

    販売・サービス・事務

    実際に手を動かしながらしたいです

    2024-10-16
  • watanabe-tat

    専門職

    質的データ、ダミー変数はワンホットエンコーディングを使う。ラベルリングデータは取り合う使いに注意する。

    2023-10-08
  • taka1962

    販売・サービス・事務

    マニュアルでデータ処理するときは前処理を頭の中で知らぬ間にしていたことがわかりました。AIではとても重要だとわかりました。

    2024-05-24
  • takemaru0530

    販売・サービス・事務

    外れ値の考え方や扱い方は勉強になりました。
    業務でも外れ値をどのように扱うかはその時のデータ集計の目的によって違います。ヒストグラムでは外れ値により形が変わるので、箱ひげ図を活用すればデータのばらつきや外れ値がわかります。業務でも箱ひげ図を活用できるようにしていきたいです。

    2024-11-20
  • take515

    メーカー技術・研究・開発

    データ前処理の基本事項が確認できた。

    2024-03-29
  • cs1960

    販売・サービス・事務

    大変、勉強になりました。

    2024-07-15
  • ken222

    営業

    01正規化と標準化の手法をしっかり覚えるとともに、外れ値の扱いについてもしっかり覚えたい。

    2024-02-12
  • pinguino

    販売・サービス・事務

    前処理として必要なことが理解できた。

    2024-08-12
  • yasupii

    その他

    講義を聞いて、機械学習は使われるデータが重要であるので、その前準備が大切であると思いました。前準備について、知っておくべき基礎的なことが分かりました。どのようなモデルを作りたいのかで、使う手法が異なるので、実践する場合に留意していきたいです。

    2023-12-29
  • miura_ka

    販売・サービス・事務

    データの前処理の必要性と、前処理の種類を確認できたため取り入れたい。

    2024-03-18
  • matute

    IT・WEB・エンジニア

    データ分析を開始する前に外れ値の処理や正規化等を行い、正しいデータ分析ができるようにしたい

    2023-11-22
  • vegitaberu

    人事・労務・法務

    データの前処理は実際に意識していることですが、スケーリングの考え方は、抜けていました。これを理解できたのが、一番の収穫でした。

    2024-05-01
  • hrkudo

    IT・WEB・エンジニア

    外れ値や質的変数の処理について理解できました。

    2024-11-15
  • dense

    メーカー技術・研究・開発

    標準化もサンプル数が少ないと、外れ値の影響を受けます…

    2024-03-09
  • stani

    専門職

    データを前処理して使いやすいものにし、長期に利用できるようにしたい。

    2023-10-30
  • shin_yako

    販売・サービス・事務

    参考になりました。実務の活用を考えます

    2024-10-06
  • 7031

    経営・経営企画

    データを扱ううえで正規化する必要があることはわかった。

    2023-11-06
  • k_k_ai

    メーカー技術・研究・開発

    外れ値の処理の仕方が勉強になりました。
    こういう考え方がある事を知ることで、データの見方がかわってきます。

    2024-05-29
  • tsukamotoya

    営業

    学習できたことを、業務や日常において活用していきます。

    2024-09-05
  • koichi_seya

    その他

    外れ値の処理などの手法が具体的に学べてよかった

    2023-10-25
  • kenjiro_fujita

    コンサルタント

    すでにあるシステムのデータ定義書を見直して、今あるデータベースはワンホットエンコードなのか、ラベルエンコードなのか確認していきたい。

    2024-01-11
  • test_test___

    メーカー技術・研究・開発

    データの前処理、特にデータの欠損をどう補完するかが勉強になった。

    2024-06-11
  • sesesese

    その他

    質的データの変換の説明はあってるのでしょうか?
    S,M,Lの3つの区分があったら、作成する項目の数は2個ではないですか?
    重回帰分析ではなくで、その他の機械学習の手法では、区分が3つの質的変数の場合、3つの変数を作成するのでしょうか?

    2024-02-07
  • yokoishida

    コンサルタント

    ぼんやりしていた部分が、はっきりわかりました。

    2024-07-24
  • chikako_k

    IT・WEB・エンジニア

    エラーになってしまう不要なデータは削除していましたが、削除にも手法があると知りました。

    2023-10-31
  • 512177

    資材・購買・物流

    データの前処理の必要性を学びました

    2024-03-18
  • t_htn

    経営・経営企画

    データの前処理n考え方が把握できた。
    データ分析を適切に行うためにも、
    しっかりデータ前処理を行いたいと思う

    2023-09-18
  • yukofunada

    販売・サービス・事務

    応用問題で分からなかった部分の理解が深まりました。

    2024-08-17
  • kk1000

    販売・サービス・事務

    ワンホットエンコーディングかラベルエンコーディングか、状況に応じて使い分けが必要だなと感じました。

    2024-04-06
  • hfkd156036

    金融・不動産 関連職

    0−1正規化と標準化の相違点を理解できた

    2024-02-29
  • ck27

    その他

    箱ひげ図などで具体的に外れ値をみながらデータを扱うことが学習できたので、活用していきたい

    2024-03-19
  • ta-mo-

    IT・WEB・エンジニア

    データにノイズがある場合、前処理は重要であり、その方法として、欠損、スケーリング、外れ値等の処理があることが分かった。
    また、質的データはワンホットエンコーディング、ラベルエンコーディングがあるのは学びであった。

    2024-09-29
  • choko0504

    メーカー技術・研究・開発

    データ分析する際の基礎的な前処理について学ぶことができた。実務でいかすことがあればいかしたい 。

    2023-12-31
  • vz3000

    IT・WEB・エンジニア

    データの前処理について理解を深めることができた。スケーリングと質的データの量的変換の違いがよく分かった。

    2024-01-27
  • yutahayasaka

    その他

    素人には難しい。1回聴き流すだけでは理解できなかった。復習したい。

    2024-06-26

関連動画コース

新着動画コース

10分以内の動画コース

再生回数の多い動画コース

コメントの多い動画コース

オンライン学習サービス部門 20代〜30代ビジネスパーソン334名を対象とした調査の結果 4部門で高評価達成!

7日間の無料体験を試してみよう

無料会員登録

期間内に自動更新を停止いただければ、料金は一切かかりません。