家豪試著以現有的數據,以時間序列演算法進行銷售預測驗證,但結果不如預期,李家豪感到沮喪,並開始了自言自語:
怎麼可能?我明明花了那麼多時間研究這個演算法,為什麼結果還是不對呢?我一定是哪裡做錯了。

家豪繼續研究著資料,試圖找出問題的所在。他認為自己可能沒有準確地選取資料,或者是沒有對資料進行適當的預先處理,因此他再次檢查了資料,並對其進行清理試圖找出問題的根本原因。
李家豪花了一個多星期的時間,仍無法找出問題,準確率也不高。怡貞看得出家豪的沮喪。
怡貞: 家豪, 你怎麼樣了,銷售預測系統的準確率還是達不到我們的期望嗎?
李家豪: 是的,我花了一個多星期的時間,但準確率最高不到40%,我找不出問題所在……
怡貞: 我明白,我們需要更多的數據來證明我們可以建置預測銷售系統,但是不要失望,我相信你會找到問題的根本原因。有沒有可能是因為你沒有考慮到某些因素?例如季節性變化、天氣、競爭對手、新產品推出等因素對銷售的影響?這些可能都是影響預測結果的因素。

怡貞相信家豪是一個很有智慧的工程師,他具有很高的專業素養,能夠精確地分析問題並找出解決方案。家豪非常專注於工作,有時會忘記時間,有時很少說話,但在會議上會講得非常清楚明白。他喜歡思考問題並找出最佳解決方案。
家豪思考靜下心思考著,自己在建置銷售預測系統時,有沒有忽略了什麼因素,他從以下角度進行思考:

  1. 數據質量:思考自己是否使用了足夠的數據來進行預測,或者數據是否準確。
  2. 演算法:所選擇的演算法是否適合這個問題,或者是否有更好的演算法可以選擇。
  3. 模型參數:是否對模型參數進行了適當的調整。
  4. 外部因素:是否沒有考慮到外部因素,例如天氣、節日等。
  5. 數據處理: 自己是否對數據做了正確的處理,或者是否應該加入更多的特徵。

並且開始重新整理他的步驟:

  1. 資料收集: 收集過去餐廳的銷售數據,包含銷售量、客人數、天氣、假日、季節、每天銷售額等資料。
  2. 資料清理: 清理資料中的缺失值、異常值、重複資料等。
  3. 資料分析: 利用統計學方法分析資料,找出資料中的規律性。
  4. 模型建立: 選用適當的時間序列分析演算法,如ARIMA、ETS等,建立模型。
  5. 模型驗證: 驗證模型的效果,並進行調整。
  6. 模型應用: 利用建立好的模型預測未來餐廳的銷售

家豪想:數據不夠完整,導致演算法無法得到足夠的訊息進行預測。另一個問題是數據中可能存在噪聲,導致演算法得到的預測結果不夠精確。為了解決這些問題,我需要進行如下步驟:

  1. 數據清理: 對數據進行清理,去除缺失值和異常值,使數據更加完整。
  2. 數據轉換: 對數據進行轉換,使其符合演算法的要求。
  3. 數據分割: 將數據分割成訓練數據和測試數據,進行演算法的訓練和驗證。
  4. 模型評估: 使用不同的指標,對演算法得到的預測結果進行評估,找到最佳模型。
  5. 模型調整: 根據評估結果,對模型進行調整,使其能夠更加精確地預測銷售。

其中包括每日銷售數量、天氣、活動等。接著,將這些資料輸入演算法中,並調整模型參數以最大化預測精準度,並且使用不同的測試數據,來比較模型的預測效果,最後選出最佳的模型參數。接著,家豪對模型進行殘差分析,來確認模型是否符合統計假設,並且確認模型是否存在過擬合或欠擬合的情況。
最後,他使用模型驗證工具來驗證模型的準確性,並根據實際銷售數據來進行模型的修正與改進,直到達到最佳預測。

頁次: 1 2 3 4 5

發表迴響

Trending

探索更多來自 數位10分鐘 的內容

立即訂閱即可持續閱讀,還能取得所有封存文章。

Continue reading