
会員限定
ビジネスパーソンのためのデータ・AIリテラシー/③データ加工
【DataRobot社 受講後アンケートにご協力ください】 アンケートにご回答いただいた方で、ご希望される方にはDataRobot社からのAI活用方法や事例、テーマの選び方、そして貴社の課題のヒアリングを目的としたフォローアップセッション(無料)を実施いただきます。アンケートのご協力の程、よろしくお願いします。 ※ リソースの関係上、全ての方にセッションを提供できない場合があります。予めご理解の程よろしくお願いします。 https://docs.google.com/forms/d/e/1FAIpQLSeQ554Km-jJqBG5MvHp0-7yIVQgxsw2ntZgSozrqxLCfGdCHA/viewform また「ビジネスパーソンのためのAI実践講座④ ~DataRobotを活用しよう~」では、DataRobotの使い方を詳しく解説しています。以下のリンクからご受講ください。 https://globis.jp/courses/a18da4a7/ ビジネスパーソンがデータやAIを活用するうえで、知っておかなければならない知識やよく直面する課題を、用語解説を交えてやさしくお伝えします。この動画では、AIによる分析の精度を上げるために重要な「データ加工」について取り扱います。データ加工のポイントを事例を交えながら、一緒に学んでいきましょう。
より理解を深め、他のユーザーとつながりましょう。
100+人の振り返り
tama56
販売・サービス・事務
説明にあった「過去のデータ」について、ただの記録としか見ていないと、単なる履歴になるが、視点を変えると、とても貴重なデータになることが理解できた。
kobamakimaki
人事・労務・法務
学習を量を増やしてただやらせれば良いと言うものではない事が勉強になりました
darumamistral
コンサルタント
RFM分析に活用できるのはないかと考えています。
stengnabe
その他
データを蓄積して解析に活かしていきたい。
sm054307
経営・経営企画
データを集めるにあたって、陳腐化しないように
集める情報、目的をもってデータ蓄積をすることが重要と感じた
watanabe-tat
専門職
POSデータ分析におけるデータ蓄積は、①データレイクにPOSレジからのCSVデータを貯め②データクレンジング後にデータウェアハウスであるデータベースに確認して③分析用に必要データに集約したデータマートで分析する。またスキャンパネルデータは、データの質と量の観点で、会員情報の履歴を残すことを留意したい。このような方針で、クロスセクションデータの保管を進めたい。
mkh8510
メディカル 関連職
データの蓄積において、いらないと思われる部分を切り捨て、整頓した状況がデータウェアハウスであることを理解しました。
しかし、講義でもありましたが、そろえられたデータが使用に耐えられるものである必要があります。業者任せの導入では、実際のデータがどう蓄積されていくかを確認する作業が必須となりますが、人数のいない部署では、確認作業ができない状況であり、使えないデータの蓄積、データウェアハウスのソフト維持費、HDDの容量の増大など、負の遺産のなる可能性があると考えます。
今、AIの活用や、NVIDIAが儲かっているなど、ニュースがあふれているが、遅れないようにかつ、導入が正しいか天秤にかけて、進めていく必要がある。
muramatsu0720
IT・WEB・エンジニア
POSデータ分析におけるデータ蓄積は、①データレイクにPOSレジからのCSVデータを貯め②データクレンジング後にデータウェアハウスであるデータベースに確認して③分析用に必要データに集約したデータマートで分析する。またスキャンパネルデータは、データの質と量の観点で、会員情報の履歴を残すことを留意したい。このような方針で、クロスセクションデータの保管を進めたい。
yamaurari
経営・経営企画
提案の中にAIが出てくる可能性があり、学ばせていただきました。とくにITに詳しくないお客様であればデータを整理・適切に蓄積するというところに面白みを感じず、優先順位を下げることが多々あります。そういった際にこういう有識者からの意見があると進めやすいです。ありがとうございます。
stani
専門職
データの蓄積について学んだ。
jshinmura
IT・WEB・エンジニア
データ蓄積は、クロスセクションデータ、時系列データ、パネルデータの3種類がある。クロスセクションデータはある時点でのデータの断面を切り取った複数の項目についてのデータ、時系列データは、ある項目を時系列で追ったデータ、パネルデータは、その両方を持ちあわせているデータがあることを学びました。また、ECサイトなどで過去のデータは捨ててしまっているが、実はそれらはデータ蓄積の観点からはとてももったいない顧客のライフステージの履歴だったりするので、その後のレコメンドなど様々な利用用途の可能性がある貴重なデータであると認識すべきであることを学びました。
masuhide
経営・経営企画
業務上様々なシーンで構築されたデータの活用を求められますが、それらデータの質と量、区分では時系列的なもの、種類など、のちに利用することを考えつつ蓄積しk手行く重要性を学びました。学習データは重要なポイントですね。
sss_k34
その他
クレンジングの先を意識して対応しないと、クレンジングだけで終了してしまうので要注意
7031
経営・経営企画
当り前ですが、データを集めるにあたって、陳腐化しないよ目的をもってデータ蓄積をすることが重要だと改めて感じました
naoki_sasano
メーカー技術・研究・開発
より精度の高い予測モデルを作ろうとした場合、現在の収集データとは別の属性データを収集することが重要であることを理解した。
k_yuna
販売・サービス・事務
少し難しい内容でした。
jintan-papa
営業
データの精度や集め方が分析を左右するという認識を新たにした。
i323
その他
データ量を集めるだけではデータは生きず、目的や質、クレンジングするといった手間が必要なことが分かった。
taiichi-yoshi
IT・WEB・エンジニア
データの鮮度が大事であることを認識しました。
kouhei728
経営・経営企画
まずは足元にあるデータを分析して、そこから何かインサイトを得られないかから始める必要があると思う。
あまり高度なデータが有っても人間が理解できなければ意味がない。
suzuzuzu
その他
とても勉強になりました
iso_ken
専門職
ここでもやはりむやみやたらにデータを集めるのではなく、通常手にしているデータから何ができるのかを考えることがまず必要。
インスピレーションもとても大事である。
kiso_2115
コンサルタント
クロスセクションデータとしての業務データ管理を検討する。
kawaguchimas229
IT・WEB・エンジニア
時系列も必要ということがわかった
mhbl_nakayama
IT・WEB・エンジニア
どの時点での情報なのか、データの断面を意識して収集・分析することの大切さを学びました。
fujii_tomohiro
その他
データ準備において質と量のバランスが必要とあるが、なかなか揃えることが難しい
sbsconts
コンサルタント
今回はAIのデータ蓄積を学びました。感覚的には受け入れやすい内容でありましたが、先ずはAIの全体像を把握する必要があると考えていますので、データ加工や環境構築等の講座を学びます。
e-yanaoka
メーカー技術・研究・開発
単にデータがあるだけでは意味がない。
データ蓄積の方法や定期的なクレンジングも必要。
haruo_02
金融・不動産 関連職
データの鮮度や履歴など、改めて考えることで価値が見いだせるものがあると気付きました。
sakamoto-aki
営業
過去のデータ=ライフステージの推移や価値観・趣向性の変容のヒントになるのだということは、見落としていた。
エンゲージメントが中途半端な状態でアンケート依頼などの頻度が多いと顧客が離れてしまう恐れもあるのでコンタクトするポイントとタイミングは最適化していくべきと感じた。
k--g--
その他
すでに収集した過去データの活用、ためになりました。
inoguchi_m
IT・WEB・エンジニア
ただデータを集めるのでなく必要なデータを取捨選択する事が重要である。過去の販売データから顧客の購入傾向分析販売計画にいかせると感じる
zummy_0617
金融・不動産 関連職
データはただやみくもに集めるのではなく必要なもの、不要なものを見分けて属性データに移行し、業務に必要な属性データをさっと取り出せば効率よくはかれるものと推測します。
huruhu3345
販売・サービス・事務
まさに過去の住所など今の業務に必要ないものは間違い防止の為に捨てていました!なるほど、そういった活用があるのかと思いました。
k_kennji
営業
データにも目的に応じた種類があり、方向性にあったものを適切に活用する必要があると思いました。
faoki
IT・WEB・エンジニア
過去の属性データの保存が重要なのは目から鱗でした。
hide-ama
メーカー技術・研究・開発
時系列データを蓄積することは労力がかかるため、ついつい最新データだけ蓄積してしまいがちです。過去データも整理して蓄積できるようにデータ構造を考えたいと思いました。
yuukahm
IT・WEB・エンジニア
データがないと外に目を向けがちだが、過去データ等内部にある属性データの活用をまずは考える。
hr-sakai
その他
過去集めたデータも役に立たない事がわかり、むやみやたらとデータ収集するのではなく少なくても質のいいデータを用いる事の大切さがわかった。
ryoma-tst
クリエイティブ
蓄積されたデータ基に分析していく
misogai
営業
只々データを集積するのではなく属性を踏まえることでより良いデータ分析を行われることが理解出来ました
akashi3661
営業
データの量だけではなく質も考慮して活用していきたいと感じました。
nonchankawaii
IT・WEB・エンジニア
蓄積されたデータが保存期間を理由に廃棄されることは非常に残念に感じていた。
ストレージが安価になった現在、第四の資産と呼ばれるデータはなるべく存続するような世の中になってほしい。
t_terakawa
メーカー技術・研究・開発
AI用データの種類を意識ていきます。
murai-nagasaki
経営・経営企画
属性など顧客データを特定の時点だけでなく、時系列で見ることで、顧客イメージが点ではなく立体的にイメージできることが理解できた。
matsu_411
専門職
データ統合を考えるのであれば,データレイクにためるデータについてAIに学習させるという視点で,数値データ・音声データ・テキストデータなどを選択するのと,データに偏りがないようにする。データウェアハウスでは,将来を見据えて全社的にどういう形にデータを加工するか決める。過去のデータ(住所など)は捨ててしまうことが多いが,AIの予測精度を高めることができる可能性があるので,保存データを絞りすぎない。
black0saku
IT・WEB・エンジニア
データ蓄積の具体的なイメージをつかむことができました。どのようなデータをどの形でデータを設置するか検討することに役立てたいと思います。
kazuma_yasuda
メーカー技術・研究・開発
データの属性を見極めて、仕分けをすることが重要ということがわかった。
またデータについて、自社の業務の中で得たデータを活用することで、より効果的な解析結果を導き出せるということも参考になった。
toshiton
メーカー技術・研究・開発
データの蓄積では、整理と工夫が必要で、外部データに頼らず、内部データをうまく活用することが大事だと感じました。業務においても、ちょうどAIモデルの改善の取り組みとして、一般公開データから製造現場データに入れ替えて、どれだけ精度向上するか、試してみたいです。その際、データクリーニングをしっかり実行します。
vegitaberu
人事・労務・法務
AIを活用するにあたり、データが重要だということは、言われていますが、ではどんなデータが必要かというと、簡単には、答えられないことが多いです。まずは、何をしたいか、何を知りたいかをはっきりしり、それに基づいて、必要なデータをそろえていくことが重要だと感じています。その際に、都合のいいデータをとりにいくだけでなく、そのようなデータは、往々にして、不可能か、コストがかかりすぎることも多いですが、今あるデータをどう使えるか考えながら、Ai分析に使えるように、仕立てていくことが重要だと思っています。
そのことを、再認識できました。
gtr_star
IT・WEB・エンジニア
外部データに依存したくなる、のところはビクッとしました。本当は大切なデータが自分たちの足元にあるのかもしれない、という視点で周りを確認したいと思います。
awanoa
IT・WEB・エンジニア
データの集め方を意識することが、分析において肝要であることを学びました。
s_kanna
メーカー技術・研究・開発
過去のデータを活かす。
michiyomichiyo
その他
歴史から学ぶように過去データからわかることもあるということですね
h_kouno
販売・サービス・事務
データの蓄積はされているのですが、システムが異なったり、フォーマットが異なったりしているケースも多々あるので結構調整に手間取っています。
taka1962
販売・サービス・事務
この講義の最後にあった、データの蓄積は、データ量の増大や型式の変更による集約上の制約で難しいが、データ圧縮等の工夫が必要です。
tkumasan
人事・労務・法務
データの蓄積には、きちんとしたルールや意図に基づき適切に実施することがよく理解できた。
touhoufuhai
販売・サービス・事務
もう使わないデータと決めつけないで、何かに使えないか、よく考えてから処理をした方が良いと感じました。
y-arano
メーカー技術・研究・開発
現在、ビックテックカンパニーが作ったAIをAPIで使用することがほとんどであるが、自社のデータを活用して、モデルを作成する場合はデータをどのように集め、使いやすいように加工するかしっかり考えていきたい。
2152321
金融・不動産 関連職
未来のデータだけではなく、過去のデータの活用を行うことも重要であるとともに、未来にのデータをどう取得するか意識したい
i_mura888
金融・不動産 関連職
データ蓄積は全ての基本で、この事が理解出来るように簡潔に解説されていてよかった。
hiropin0165
IT・WEB・エンジニア
これまでに蓄積したデータの重要性の理解と必要なデータと必要のないデータとのすみ分けを行う必要があることを理解した。
cs1960
販売・サービス・事務
大変参考になり勉強になりました。
morita_kenji
人事・労務・法務
既にあるデータを活用することも大切であることを学んだ。人事データは様々な観点で集められているので、活用の余地は大きい気がする。
murata0207
専門職
データの質を高めることが大事だと学んだ。
yumetaro
建設・土木 関連職
データ蓄積について、学んだことを今後活用していきたい。
stag
経理・財務
データクリーニングは大変。人力でやるので間違いも起きる。
yasu-hero
販売・サービス・事務
過去のデータ分析が重要
hashiryo8
その他
既に今あるデータをしっかりと保存し活用していくのが最初に行うステップとあったので、現業務のデータの活用をまずは考えてみたいと思います。
yamatakuishi
販売・サービス・事務
データを蓄積するには、生データをまとめるウェアハウスと、データマートが必要であることを理解した。
まずは、今あるデータをクロスセクションデータとしてまとめておくことを継続していこうと思う。
データの質を高めるための「データクリーニング」については、具体的な方法やクリーニング対象になるデータの理解が足りていないと感じるため、ここについては学習を継続していきたい。
mana_ka
その他
データの蓄積において、工夫と準備が必要ということ。
大量にデータを集めればよいではない。間違えたデータを集めると分析が
正しい方向に行かず、鈍化すること。
一つの要素の種類より、複数の要素で種類がある方がいいということ。
funakawa
専門職
時間の経過と共に分析方法が変わり、取得するデータの種類が変わることもあると思います。保存するデータの種類、また、AIで予測するパラメータを明確にする必要があると感じた。
1982103
その他
改めて、それらのデータをもとに何がしたいのか、を最初に明確にしないと、スタート時点から間違ってしまうのでだなを思いました。
a2202894
その他
ライフステージの移ろいによる各属性への影響について、課題だと感じていたところでとても興味深く感じました。
データの蓄積でも取捨選択が必要であること、どれを選択すればいいか迷ってしまいがちですが、何を決めてにしたら一番良いのでしょうか。
stsujimura
IT・WEB・エンジニア
情報の粒度が大事だということがわかった。
inyourmind
建設・土木 関連職
「ある部署だけで限定的にデータクリーニングを実施すると、別の部署との不整合が生じ、クリーニングの意味が薄れることもある」というのは参考になったので今後に活かしたい。
hirokatsu
経営・経営企画
学習 正解がわかっているデータでAIを作るフェーズ → 予測
データクリーニング
クロスセクションデータ 時系列データ パネルデータ
(一定の期間のデータを横並びで保管したもの)
データをためる方法が間違っているとデータが腐ってしまう
今取れているデータを活用していく
naokix
建設・土木 関連職
クロスデータとよばれるデータの断面、過去履歴を保存しておくと分析に役に立つ可能性があることが理解できた
risa_sss
販売・サービス・事務
データを集めればいいというわけではなく、そのデータの管理といったところも肝心なことに気づきました。
makidayo
IT・WEB・エンジニア
闇雲にデータを貯めればいいものでもないんだなということが理解できた。
shopoo
販売・サービス・事務
既に取得済みのデータを使用し、活用する方法を考えることが重要だと感じました。
shin-53
メーカー技術・研究・開発
必要となるデータをいかに蓄積するか、過去のデータの重要性を理解した。自分の業務にどう当てはまるのかはなかなか思いつかない。
pinguino
販売・サービス・事務
過去の属性データについては必要な場面もあるだろうと思うが、蓄積が必須なのかもう少し考えたい。
fumiyo_jou
経理・財務
クロスセクションデータ、過去の断面における属性データを活用することがポイントであることは理解した。当社の場合、あまりに過去のデータが多すぎてデータとして残っていないので、過去のデータをデジタルデータに変換するところから始めるのが課題であると思う。
morimachi_128
営業
データは量が多ければいいわけではなく質・種類の多さが大切。
営業時にヒアリングしたデータの整理の仕方は要検討である。
kei_sawai
人事・労務・法務
ローデータを加工して使いやす形においておく
ichikr
マーケティング
データは保存の仕方も重要である。普段の業務で取得している属性データも、業務面で不要になったから削除するというのではなく、「データの断面」として保存しておくことで、後々の情報活用で精度向上に使うことができる。
tasu-o
コンサルタント
動画でお話があった通り住所変更などの情報は誤配送の懸念から削除していましたが、様々なデータと結びつけることができると気付きを得ました。トラブルの防止と運用面を鑑みてデータを活かすことができないかを検討したいと感じました。
aokitaka-tci
その他
データ蓄積について質と量ともバランスよく確保していくようにしたい
sato4bb
販売・サービス・事務
蓄積してきたデータをどの様に活用するのか色々な視点で見る必要があると感じた
hrkudo
IT・WEB・エンジニア
目的を定め、どのようにデータ蓄積するか、またデータを蓄積していくかのルールを定めていくことが大切だと学びました。
ucchiy50
その他
まずはどんな活用領域にチャレンジしたいのか、目的を明確にしたい。
kitajima-n
販売・サービス・事務
まずはデータを保存する重要性を学びました
nisiusuke
販売・サービス・事務
すでに入手できているデータの活用から考える。
データの量より種類の多さ。そして質。
tak71_5515
コンサルタント
データの蓄積に関してその偉大な効力を理解することができました。具体的にお客様へお話をする際の情報としても非常に整理されたコンテンツでとても勉強になりました
rl-masayuki
その他
審査するうえで過去のデータの蓄積や分類分けを行うがより時系列なてんも注意し正確な審査ができるよう心掛ける
vivinana
販売・サービス・事務
過去のデータの重要性は認識しているものの、なかなか保存や活用時のデータ容量との兼ね合いで運用が難しいことを改めて再認識しました
hal-
マーケティング
データ蓄積の用語(データレイク、データウェアハウス、データマート)をなんとなく使っていたので、勉強になりました。過去データの蓄積は、業務視点だと蓄積することを判断するのが難しいように感じました。
hi-std
IT・WEB・エンジニア
過去データを見直すことはあまりなかったが、大切だという事がわかった。また、データの量も質も大事。
nagase29
営業
動画に人が登場して話すことによって集中力が上がっりますね。データの収集の管理をクリーニングしておくことが大切なことがわかりました。また、過去の属性も管理しておくと他のデータのり処理にも有効になることがわかった。