共同研究「機械学習を用いた販売数の予測及びその有効性の検証」レポート
2022年11月04日
しまねソフト研究開発センターでは、株式会社イーシーアイならびに株式会社テクノプロジェクトと「機械学習を用いた販売数の予測及びその有効性の検証」をテーマとして共同研究を行いました。
以下に取組の内容を紹介します。
共同研究の目的
株式会社イーシーアイでは、売上実績等を基に商品毎の販売数量の予測値を算出(現行ルール)し、小売店舗の発注・仕入れに援用しているが、実際の販売数と乖離が生じており、より高い精度の販売数予測を実現したいと考えていた。本研究では、機械学習を活用した販売数の予測を試行し、従来の手法に基づく予測値と比較等を行うことで、その有効性を評価した。
共同研究実施期間
令和4年1月11日 ~ 令和4年7月10日
共同研究の内容
(1) 機械学習用データの作成・特徴量エンジニアリング
販売数実績データのうち、返品や客注、現在は廃盤となっている商品など販売数の予測に不要なデータを除外したのち、入力ミス等によって生じた誤りや欠損を訂正・補完するため、分析者とシステム管理者が協働してデータの整理を行った。また、店舗の規模と商品数の規模から評価に用いるデータを同一店舗・同一ジャンルの商品に絞り込んだ。
現行ルールによる販売数予測では、主に7日間の合計販売数量を予測していることから、販売数実績を商品別に7日単位で集計して使用した。また、過去の販売傾向を表すデータを集計値から算出して特徴量(説明変数)に加えた。
(2) 販売数予測モデルの構築・現行ルールとの比較
作成した機械学習用データを学習用データ(学習期間)と評価データ(予測期間)に分割して予測モデルを学習・予測させた後、予測結果の精度(誤差)を現行ルールと比較した。比較にあたっては「データ全体」、「実販売数別」、「ジャンル別」、「商品別」に観点を分けてそれぞれ精度を比較した。
<データ全体の比較>
全ての実販売数データと予測値データから誤差を算出して比較した結果、機械学習モデルを用いた予測と現行ルールによる予測には大きな違いがないことが分かった。
<実販売数別の比較、ジャンル別の比較、商品別の比較>
実販売数別、ジャンル別、商品別に誤差を算出して比較した結果、いずれの比較においても機械学習モデルを用いた予測と現行ルールによる予測には大きな違いがないことが分かった。
(3) 評価と考察
過去の販売数実績から作成した特徴量で学習させた機械学習モデルで現行ルールと大差ない予測が実現可能であること(大幅な予測精度向上は難しいこと)が分かった。今回の機械学習モデルは、販売数量の実績のみを集計・加工した特徴量で学習・予測を行なっているが、店舗が設置されている館の集客情報などを特徴量に加えることで予測精度を向上できる可能性があると考えられる。
予測結果の活用(発注・仕入れへの援用)の観点から、以下のようなデータ活用の可能性があると考えられる。
・過去の販売数予測と実績との誤差を発注担当者が利用するシステムに可視化し、発注担当者の意思決定の参考とする。
・予測精度を定期的にモニタリングし、予測方式の改善判断等に活用する。
共同研究から得られたこと、分かったこと
- 株式会社イーシーアイ
予測精度としては現状の生成ルールと機械学習とでは大きな改善に繋がるものにはならなかったが、店舗運営の視点から考えると商品トレンドやイベントといった集客要因、天候等の要素があり、予測する仕組みに現状の「売上数」「売上(金額)順位」「在庫数」以外にも取り入れた方がいいと思われるデータを収集・活用・分析する方向で検討したい。
- 株式会社テクノプロジェクト
実運用で発生する生のデータを使った機械学習に取り組めた。大量データを可視化し傾向を把握するために様々な切り口で分析ができた。クライアントにヒアリングをしながらデータの加工方針を定めるなど貴重な経験ができた。
評価結果を伝えるためには評価指標だけでなく、表やグラフ用いて効果的に可視化をするなど、データを扱うスキルだけでなく伝えるスキルも非常に重要だと感じた。
分析側が用いる用語とクライアントが業務で使用している用語を相互に理解すること、そのためには前提条件を含めた共通言語を定めるための時間が必要であることが分かった。
分析側が使用するマシンスペックの制約で大量データを処理するために想定以上に時間を要した。クラウド環境の利用を含め、プロジェクト開始時に十分な環境の準備が必要であることが分かった。
今後の事業方針等について
- 株式会社イーシーアイ
両社でデータ分析した結果、売上上位の定番消耗品の売上予測が実際の売上数から大きく乖離していたものが見受けられた。売れ筋商品のチャンスロスは特に防ぎたい為、今後は具体的な商品毎に「消耗品フラグ」を設け、過去売上データから店舗で欠品しない在庫量を持たせるような生成ルールに変えていく。
また、各店から館で実施している(特に集客が見込める)各種イベントの詳細情報を収集し、その日付の売上傾向を分析後、生成在庫日数を変動させるといった対策を取る。
定期的に実施されるイベントや、年に数回の大きく売り上げ上昇が見込めるイベントに合わせて商品を供給することで売上に貢献する仕組みとする。
- 株式会社テクノプロジェクト
今回得られた知見をもとに、データ分析と活用するための技術力をさらに向上していきたい。
そのうえで企業様がもたれているデータを活用することで企業様の抱える課題解決に貢献していきたいと考えている。
担当研究員からのコメント
しまねソフト研究開発センター 専門研究員 高木 丈智
本研究の結果として、機械学習を用いた予測は現行ルールによる予測を超えるものには至りませんでしたが、データを探索的に調査・分析する過程や、予測精度を比較・評価する過程において、「予測の改善」に囚われないデータ活用の可能性が導き出されました。機械学習の適用を検討する場合、予測の精度を上げることに注目が向けられがちですが、予測の対象となるデータを精査し分析する過程において、現状の課題が定量的に捉えられるようになったことで、思いがけない気付や新たな発想が得られることは少なくありません。今後の両社の活動においても、課題を定量的に捉えると同時に、施策の効果を測りながら改善活動が継続されることを願っています。
問い合わせ先
公益財団法人しまね産業振興財団 しまねソフト研究開発センター(ITOC) 担当:内部
〒690-0816 島根県松江市北陵町1番地 テクノアークしまね2F
TEL:0852-61-2225 FAX: 0852-61-3322 itoc@s-itoc.jp