![ビジネスパーソンのためのデータ・AIリテラシー/③データ加工](https://static.unlimited.globis.co.jp/uploads/course/photo/5122/thumb_00-b558e2b006686948fa2062210f73fe89bf11ac7e141937b917437d9e35dffa69.png)
ビジネスパーソンのためのデータ・AIリテラシー/③データ加工
【DataRobot社 受講後アンケートにご協力ください】 アンケートにご回答いただいた方で、ご希望される方にはDataRobot社からのAI活用方法や事例、テーマの選び方、そして貴社の課題のヒアリングを目的としたフォローアップセッション(無料)を実施いただきます。アンケートのご協力の程、よろしくお願いします。 ※ リソースの関係上、全ての方にセッションを提供できない場合があります。予めご理解の程よろしくお願いします。 https://docs.google.com/forms/d/e/1FAIpQLSeQ554Km-jJqBG5MvHp0-7yIVQgxsw2ntZgSozrqxLCfGdCHA/viewform また「ビジネスパーソンのためのAI実践講座④ ~DataRobotを活用しよう~」では、DataRobotの使い方を詳しく解説しています。以下のリンクからご受講ください。 https://globis.jp/courses/a18da4a7/ ビジネスパーソンがデータやAIを活用するうえで、知っておかなければならない知識やよく直面する課題を、用語解説を交えてやさしくお伝えします。この動画では、AIによる分析の精度を上げるために重要な「データ加工」について取り扱います。データ加工のポイントを事例を交えながら、一緒に学んでいきましょう。
会員限定
より理解を深め、他のユーザーとつながりましょう。
72人の振り返り
tama56
販売・サービス・事務
説明にあった「過去のデータ」について、ただの記録としか見ていないと、単なる履歴になるが、視点を変えると、とても貴重なデータになることが理解できた。
kouhei728
経営・経営企画
まずは足元にあるデータを分析して、そこから何かインサイトを得られないかから始める必要があると思う。
あまり高度なデータが有っても人間が理解できなければ意味がない。
watanabe-tat
専門職
POSデータ分析におけるデータ蓄積は、①データレイクにPOSレジからのCSVデータを貯め②データクレンジング後にデータウェアハウスであるデータベースに確認して③分析用に必要データに集約したデータマートで分析する。またスキャンパネルデータは、データの質と量の観点で、会員情報の履歴を残すことを留意したい。このような方針で、クロスセクションデータの保管を進めたい。
i_mura888
金融・不動産 関連職
データ蓄積は全ての基本で、この事が理解出来るように簡潔に解説されていてよかった。
1982103
その他
改めて、それらのデータをもとに何がしたいのか、を最初に明確にしないと、スタート時点から間違ってしまうのでだなを思いました。
akashi3661
営業
データの量だけではなく質も考慮して活用していきたいと感じました。
michiyomichiyo
その他
歴史から学ぶように過去データからわかることもあるということですね
sss_k34
その他
クレンジングの先を意識して対応しないと、クレンジングだけで終了してしまうので要注意
nagamatsu-naoki
金融・不動産 関連職
データの鮮度や履歴など、改めて考えることで価値が見いだせるものがあると気付きました。
yamatakuishi
販売・サービス・事務
データを蓄積するには、生データをまとめるウェアハウスと、データマートが必要であることを理解した。
まずは、今あるデータをクロスセクションデータとしてまとめておくことを継続していこうと思う。
データの質を高めるための「データクリーニング」については、具体的な方法やクリーニング対象になるデータの理解が足りていないと感じるため、ここについては学習を継続していきたい。
sakamoto-aki
営業
過去のデータ=ライフステージの推移や価値観・趣向性の変容のヒントになるのだということは、見落としていた。
エンゲージメントが中途半端な状態でアンケート依頼などの頻度が多いと顧客が離れてしまう恐れもあるのでコンタクトするポイントとタイミングは最適化していくべきと感じた。
k--g--
その他
すでに収集した過去データの活用、ためになりました。
s_kanna
メーカー技術・研究・開発
過去のデータを活かす。
misogai
営業
只々データを集積するのではなく属性を踏まえることでより良いデータ分析を行われることが理解出来ました
kawaguchimas229
IT・WEB・エンジニア
時系列も必要ということがわかった
masuhide
経営・経営企画
業務上様々なシーンで構築されたデータの活用を求められますが、それらデータの質と量、区分では時系列的なもの、種類など、のちに利用することを考えつつ蓄積しk手行く重要性を学びました。学習データは重要なポイントですね。
y-arano
メーカー技術・研究・開発
現在、ビックテックカンパニーが作ったAIをAPIで使用することがほとんどであるが、自社のデータを活用して、モデルを作成する場合はデータをどのように集め、使いやすいように加工するかしっかり考えていきたい。
matsu_411
専門職
データ統合を考えるのであれば,データレイクにためるデータについてAIに学習させるという視点で,数値データ・音声データ・テキストデータなどを選択するのと,データに偏りがないようにする。データウェアハウスでは,将来を見据えて全社的にどういう形にデータを加工するか決める。過去のデータ(住所など)は捨ててしまうことが多いが,AIの予測精度を高めることができる可能性があるので,保存データを絞りすぎない。
h_kouno
販売・サービス・事務
データの蓄積はされているのですが、システムが異なったり、フォーマットが異なったりしているケースも多々あるので結構調整に手間取っています。
nonchankawaii
IT・WEB・エンジニア
蓄積されたデータが保存期間を理由に廃棄されることは非常に残念に感じていた。
ストレージが安価になった現在、第四の資産と呼ばれるデータはなるべく存続するような世の中になってほしい。
2152321
金融・不動産 関連職
未来のデータだけではなく、過去のデータの活用を行うことも重要であるとともに、未来にのデータをどう取得するか意識したい
taiichi-yoshi
IT・WEB・エンジニア
データの鮮度が大事であることを認識しました。
murata0207
専門職
データの質を高めることが大事だと学んだ。
vegitaberu
人事・労務・法務
AIを活用するにあたり、データが重要だということは、言われていますが、ではどんなデータが必要かというと、簡単には、答えられないことが多いです。まずは、何をしたいか、何を知りたいかをはっきりしり、それに基づいて、必要なデータをそろえていくことが重要だと感じています。その際に、都合のいいデータをとりにいくだけでなく、そのようなデータは、往々にして、不可能か、コストがかかりすぎることも多いですが、今あるデータをどう使えるか考えながら、Ai分析に使えるように、仕立てていくことが重要だと思っています。
そのことを、再認識できました。
cs1960
販売・サービス・事務
大変参考になり勉強になりました。
faoki
IT・WEB・エンジニア
過去の属性データの保存が重要なのは目から鱗でした。
morita_kenji
人事・労務・法務
既にあるデータを活用することも大切であることを学んだ。人事データは様々な観点で集められているので、活用の余地は大きい気がする。
yamaurari
経営・経営企画
提案の中にAIが出てくる可能性があり、学ばせていただきました。とくにITに詳しくないお客様であればデータを整理・適切に蓄積するというところに面白みを感じず、優先順位を下げることが多々あります。そういった際にこういう有識者からの意見があると進めやすいです。ありがとうございます。
iso_ken
専門職
ここでもやはりむやみやたらにデータを集めるのではなく、通常手にしているデータから何ができるのかを考えることがまず必要。
インスピレーションもとても大事である。
tkumasan
人事・労務・法務
データの蓄積には、きちんとしたルールや意図に基づき適切に実施することがよく理解できた。
stani
専門職
データの蓄積について学んだ。
funakawa
専門職
時間の経過と共に分析方法が変わり、取得するデータの種類が変わることもあると思います。保存するデータの種類、また、AIで予測するパラメータを明確にする必要があると感じた。
fujii_tomohiro
その他
データ準備において質と量のバランスが必要とあるが、なかなか揃えることが難しい
jintan-papa
営業
データの精度や集め方が分析を左右するという認識を新たにした。
touhoufuhai
販売・サービス・事務
もう使わないデータと決めつけないで、何かに使えないか、よく考えてから処理をした方が良いと感じました。
ryoma-tst
クリエイティブ
蓄積されたデータ基に分析していく
hr-sakai
その他
過去集めたデータも役に立たない事がわかり、むやみやたらとデータ収集するのではなく少なくても質のいいデータを用いる事の大切さがわかった。
hide-ama
メーカー技術・研究・開発
時系列データを蓄積することは労力がかかるため、ついつい最新データだけ蓄積してしまいがちです。過去データも整理して蓄積できるようにデータ構造を考えたいと思いました。
suzuzuzu
その他
とても勉強になりました
7031
経営・経営企画
当り前ですが、データを集めるにあたって、陳腐化しないよ目的をもってデータ蓄積をすることが重要だと改めて感じました
darumamistral
コンサルタント
RFM分析に活用できるのはないかと考えています。
toshiton
メーカー技術・研究・開発
データの蓄積では、整理と工夫が必要で、外部データに頼らず、内部データをうまく活用することが大事だと感じました。業務においても、ちょうどAIモデルの改善の取り組みとして、一般公開データから製造現場データに入れ替えて、どれだけ精度向上するか、試してみたいです。その際、データクリーニングをしっかり実行します。
hashiryo8
その他
既に今あるデータをしっかりと保存し活用していくのが最初に行うステップとあったので、現業務のデータの活用をまずは考えてみたいと思います。
k_yuna
販売・サービス・事務
少し難しい内容でした。
awanoa
IT・WEB・エンジニア
データの集め方を意識することが、分析において肝要であることを学びました。
taka1962
販売・サービス・事務
この講義の最後にあった、データの蓄積は、データ量の増大や型式の変更による集約上の制約で難しいが、データ圧縮等の工夫が必要です。
t_terakawa
メーカー技術・研究・開発
AI用データの種類を意識ていきます。
mana_ka
その他
データの蓄積において、工夫と準備が必要ということ。
大量にデータを集めればよいではない。間違えたデータを集めると分析が
正しい方向に行かず、鈍化すること。
一つの要素の種類より、複数の要素で種類がある方がいいということ。
inoguchi_m
IT・WEB・エンジニア
ただデータを集めるのでなく必要なデータを取捨選択する事が重要である。過去の販売データから顧客の購入傾向分析販売計画にいかせると感じる
stag
経理・財務
データクリーニングは大変。人力でやるので間違いも起きる。
kiso_2115
コンサルタント
クロスセクションデータとしての業務データ管理を検討する。
muramatsu0720
IT・WEB・エンジニア
POSデータ分析におけるデータ蓄積は、①データレイクにPOSレジからのCSVデータを貯め②データクレンジング後にデータウェアハウスであるデータベースに確認して③分析用に必要データに集約したデータマートで分析する。またスキャンパネルデータは、データの質と量の観点で、会員情報の履歴を残すことを留意したい。このような方針で、クロスセクションデータの保管を進めたい。
yasu-hero
販売・サービス・事務
過去のデータ分析が重要
sbsconts
コンサルタント
今回はAIのデータ蓄積を学びました。感覚的には受け入れやすい内容でありましたが、先ずはAIの全体像を把握する必要があると考えていますので、データ加工や環境構築等の講座を学びます。
sm054307
経営・経営企画
データを集めるにあたって、陳腐化しないように
集める情報、目的をもってデータ蓄積をすることが重要と感じた
zummy_0617
金融・不動産 関連職
データはただやみくもに集めるのではなく必要なもの、不要なものを見分けて属性データに移行し、業務に必要な属性データをさっと取り出せば効率よくはかれるものと推測します。
gtr_star
IT・WEB・エンジニア
外部データに依存したくなる、のところはビクッとしました。本当は大切なデータが自分たちの足元にあるのかもしれない、という視点で周りを確認したいと思います。
i323
その他
データ量を集めるだけではデータは生きず、目的や質、クレンジングするといった手間が必要なことが分かった。
black0saku
IT・WEB・エンジニア
データ蓄積の具体的なイメージをつかむことができました。どのようなデータをどの形でデータを設置するか検討することに役立てたいと思います。
yuukahm
IT・WEB・エンジニア
データがないと外に目を向けがちだが、過去データ等内部にある属性データの活用をまずは考える。
kazuma_yasuda
メーカー技術・研究・開発
データの属性を見極めて、仕分けをすることが重要ということがわかった。
またデータについて、自社の業務の中で得たデータを活用することで、より効果的な解析結果を導き出せるということも参考になった。
jshinmura
IT・WEB・エンジニア
データ蓄積は、クロスセクションデータ、時系列データ、パネルデータの3種類がある。クロスセクションデータはある時点でのデータの断面を切り取った複数の項目についてのデータ、時系列データは、ある項目を時系列で追ったデータ、パネルデータは、その両方を持ちあわせているデータがあることを学びました。また、ECサイトなどで過去のデータは捨ててしまっているが、実はそれらはデータ蓄積の観点からはとてももったいない顧客のライフステージの履歴だったりするので、その後のレコメンドなど様々な利用用途の可能性がある貴重なデータであると認識すべきであることを学びました。
naoki_sasano
メーカー技術・研究・開発
より精度の高い予測モデルを作ろうとした場合、現在の収集データとは別の属性データを収集することが重要であることを理解した。
huruhu3345
販売・サービス・事務
まさに過去の住所など今の業務に必要ないものは間違い防止の為に捨てていました!なるほど、そういった活用があるのかと思いました。
e-yanaoka
メーカー技術・研究・開発
単にデータがあるだけでは意味がない。
データ蓄積の方法や定期的なクレンジングも必要。
k_kennji
営業
データにも目的に応じた種類があり、方向性にあったものを適切に活用する必要があると思いました。
stengnabe
その他
データを蓄積して解析に活かしていきたい。
yumetaro
建設・土木 関連職
データ蓄積について、学んだことを今後活用していきたい。
hiropin0165
IT・WEB・エンジニア
これまでに蓄積したデータの重要性の理解と必要なデータと必要のないデータとのすみ分けを行う必要があることを理解した。
mkh8510
メディカル 関連職
データの蓄積において、いらないと思われる部分を切り捨て、整頓した状況がデータウェアハウスであることを理解しました。
しかし、講義でもありましたが、そろえられたデータが使用に耐えられるものである必要があります。業者任せの導入では、実際のデータがどう蓄積されていくかを確認する作業が必須となりますが、人数のいない部署では、確認作業ができない状況であり、使えないデータの蓄積、データウェアハウスのソフト維持費、HDDの容量の増大など、負の遺産のなる可能性があると考えます。
今、AIの活用や、NVIDIAが儲かっているなど、ニュースがあふれているが、遅れないようにかつ、導入が正しいか天秤にかけて、進めていく必要がある。
murai-nagasaki
経営・経営企画
属性など顧客データを特定の時点だけでなく、時系列で見ることで、顧客イメージが点ではなく立体的にイメージできることが理解できた。
mhbl_nakayama
IT・WEB・エンジニア
どの時点での情報なのか、データの断面を意識して収集・分析することの大切さを学びました。