[分享] 捷運百億人次預測

作者: togetherhoo   2019-03-15 23:22:53
圖文好讀板 https://reurl.cc/qVd1D
台北捷運100億人次即將降臨
到底該應援哪條捷運線?
北捷旅運量即將突破百億
編號第100億旅客將會誕生在哪一條捷運線?
是地下情人板南線、
最有情有義的中和新蘆線、
還是最國際化的Songshanxindian Line?
台北捷運與簡訊設計團隊近日共同策劃迎接北捷百億運量系列宣傳活動
掀起一場捷運之亂
其中最引起大家討論的話題
便是創建捷運線擬人角色
用FB帳號直接在線上與群眾互動
進行拉票競賽
說到應援捷運線
除了憑感覺選最多人的那條之外
有沒有其他方法可以幫助我們更準確地預測百億人次?
3/9台北捷運臉書發布了一則對預測很有幫助的快報
讓我們進一步去想
透過過往北捷運量資料分析
是不是能夠更有力地推斷這位編號100億旅客將在何處誕生
首先要有能拿來推算運量的資料
能夠最直接了解台北捷運各站流量的資料來自台北捷運公司2017年起開放的臺北捷運各
站分時進出量統計
由於統計資料公布會有一段時間延遲
我們沒辦法即時知道今年3月的數據
只能透過歷史資料進行推算
綜觀過去幾年每個月的單日平均運量
2016年後沒有新的捷運站通車
每年同期的運量開始趨於穩定
成長率多落在1~3%
反而是同一年中不同月份的運量影響差異更大
(如冬季運量大於夏季;2018、2016年2月、2017年1月農曆新年運量較低)
所以我們選擇以去年同期(2018年3月)的捷運運量資料作為這次推算百億人次的主要依據
https://cdn-images-1.medium.com/max/1000/1*jxRAoIB7p9CSMlM-iUKKBw.png
而捷運的使用與民眾上班通勤息息相關
我們進一步檢視
在同一個月份中
影響單日運量的因素,主要取決於當天是星期幾(day of week)
平日運量較大、週末運量較小
所以假若我們要推算今年3/13(三)的單日運量
應以「去年3月的禮拜三」來推估
而不應用「去年3月13號」
https://cdn-images-1.medium.com/max/1000/1*HDED22HazUJsM-QMGM08QQ.png
確認分析資料後,我們試圖回答2個問題:
Q1:捷運百億人次將出現在哪一天?
雖然預測時間並非這次的活動內容
但因台北捷運會不定期的發布人次快報
(從99.5億每隔1千萬發布一次)
我們可以根據快報提供的資訊修正推估模式的參數
讓後面的機率推計更加精確
官方活動『尋找台北捷運編號100億』的預測及應援截止時間為3/28
表示編號百億出現的時間應在3月底至4月初之間
若以旅運量推算
配合99.5憶及99.6億人次快報提供的資訊
我們可以做更細緻的計算 :
https://cdn-images-1.medium.com/max/1000/1*73CfZlihc6qcS2ZQh5ijng.png
台北捷運第一百億人次大約會出現在3/31(日)下午
大家在大安森林公園聽捷運100大金曲的時候
這位可以一年免費搭捷運的幸運兒可能就誕生了
Q2: 投哪個捷運站/捷運線機率最高?
根據前面的時間推估
百億人次約出現在週日的下午
我們進一步計算週日下午各個捷運站的「進站人次」
作為機率推算基礎
從機率分布圖可以看到
運量第一、第二高的兩個捷運站所占的流量便達到總量約13%
剩餘捷運站運量占比則由2%左右緩慢遞減
https://cdn-images-1.medium.com/max/1000/1*Qm5R4VUjJc7tRPbBKALFUw.png
把運量最高前10名的捷運站列出來
會發現板南線上的捷運站就占了6名
包含運量最高的兩站,台北車站與西門
都是假日市民會時常進出的大站
https://cdn-images-1.medium.com/max/1000/1*4f5fONJlQdRqidb9sLtsIw.png
至於應援捷運線
其實從上面結果大概已經能猜出運量最高的線是誰
但為求精確,我們還是對資料做了一些處理
由於台北捷運有許多兩線交會的轉運站
在計算上會將進站量分別加入兩條捷運線
如台北車站會計入紅、藍線、西門站則會計入藍、綠線
https://cdn-images-1.medium.com/max/1000/1*SrRJAisfZ626cWWn7Bdwkw.png
從分布結果來看
板南線果然是大家的地下情人
是假日往返台北市區不可或缺的重要幹線
而淡水信義線也不惶多讓,包辦了超過1/4的運量
小結
把上面各捷運站/線的機率分布圖與截至今天為止官網應援活動的人數比對
可以發現,除了榜首台北車站及板南線外
大家的選擇順序和實際計算出來的分布有蠻大的差異
例如淡水信義線運量與板南線不相上下
但票數卻差了將近一倍
而最近中和新蘆線的魅力太強
拉到的票反而些微超越淡水信義線
而捷運戰報則可以看到不少運量在10名外的捷運站出現在榜上
可見大家對自己所愛的捷運站/線
是遠超過單純的機率計算的!!
https://cdn-images-1.medium.com/max/1000/1*4GKD9egsgBNW9QQTeRQWmg.png
結論: 選自己所愛
雖然絮絮叨叨算了很多數學
但這次的應援活動也不是要大家下注買樂透
或狂搭捷運期待自己刷中編號第一百億旅客
在這次活動的過程中
從群眾討論到在FB上與各條捷運線互動
我們也看到台北捷運對於雙北市民而言
是多麼特別的生活經驗。
所以,自己的捷運自己挺,勇敢的選擇自己所愛吧!!
(甚麼結論?)
https://cdn-images-1.medium.com/max/1000/1*6kWvEDP-JVxeWB5PChQaGg.jpeg
我們是openbird studio
本次資料分析一樣是由之前分享
#依人流變化替捷運站點分類
#以熱圖呈現台北捷運分時人流變化
的作者 unhuman 所操刀
作者: kuso10582 (Piscine)   2019-03-16 00:18:00
厲害...不過我覺得這種東西就是機率性啦大站相對比較有可能 但小站也是有機會
作者: Johnnyyang (Johnnyyjy)   2019-03-16 00:46:00
還可以再逐小時分析單日全系統、各站的累積運量
作者: bahia (bahia)   2019-03-16 01:16:00
希望最後結果是爆冷
作者: sleepyrat (sleepyrat)   2019-03-16 01:20:00
希望是落在爐主手上~~
作者: StarFox0910 (閉嘴 低能兒)   2019-03-16 01:59:00
登愣 小碧潭(X
作者: jh961202 (阿電)   2019-03-16 02:31:00
不愧是資料科學分析師
作者: naruto1010 (鳴人)   2019-03-16 07:48:00
為什麼會有阿達王子亂入w
作者: tony900735 (大頭)   2019-03-16 10:23:00
XDDDD
作者: Mytsb2421 (Mytsb2421)   2019-03-16 10:48:00
百億人次如果是現金購票,會查的到嗎?
作者: hicker (救護車專載笑到腹肌抽筋)   2019-03-16 10:59:00
現金購票一樣是要拿單程票代幣刷過閘門呀....這樣問倒想到 如果百億人次的時間點出現團體票進站呢??
作者: ting445 (PPTTTTTT)   2019-03-16 11:10:00
結果最後在小碧潭XD
作者: blackwind910 (風玄的某個親戚也叫風玄)   2019-03-16 11:29:00
我猜萬芳社區(X
作者: tyytt (踢歪歪踢踢)   2019-03-16 11:37:00
原來那些帳號是官方創的
作者: ji394xu3 (薩埵十二惡皆空)   2019-03-16 12:31:00
機率這種東西就跟樂透頭獎開在什麼縣市一樣看運氣...
作者: chuegou (chuegou)   2019-03-16 12:59:00
現在流行在數據分析文下面討論運勢嗎我覺得我運氣不錯 選我正解
作者: ihl123456 (雨風評)   2019-03-16 13:04:00
一位公務員長期患有三高疾病,經常往返萬芳醫院回診,結果看完醫生回去進站時突然發現一隻鴿子一直對他叫,沒想到就成了捷運百億人次。
作者: jackwula9211 (Carbon.)   2019-03-16 13:14:00
結果出現在新北投站
作者: chluke (慎)   2019-03-16 13:23:00
如果是買代幣進入,如何知道乘客的身份
作者: hicker (救護車專載笑到腹肌抽筋)   2019-03-16 13:44:00
遊戲辦法還是要北捷自己說了算....
作者: Nostalgia104 (No)   2019-03-16 14:47:00
我猜單程票不列入計算 因為投進去根本死無對證除非調監視器去對
作者: Mytsb2421 (Mytsb2421)   2019-03-16 19:34:00
記者要拍百億人次,不知道要去哪一站等要不限制一下旅客行動,等官方或記者來說恭喜
作者: aquarsx3 (長耳跳兔)   2019-03-16 20:13:00
https://i.imgur.com/4PYZnhM.jpg公告不就寫明單程票不算了?
作者: abcd880201 (CrazyEgg)   2019-03-16 22:33:00
唯一支持小碧潭
作者: earthuncuttv (追風者)   2019-03-16 23:03:00
最後在小碧潭站
作者: ultradev (QQ)   2019-03-16 23:08:00
小碧潭,新聞稿順便業配央北的建案與IKEA
作者: hicker (救護車專載笑到腹肌抽筋)   2019-03-16 23:45:00
原來只採計電子票證喔....我承認沒看規則 XDD可是這樣....只採計電子票證的第100億人次 也不是準確的吧搭乘人次當然包含單程票與團體票的人次
作者: ultradev (QQ)   2019-03-17 00:17:00
這是行銷活動,準不準確不重要,差不多就好了
作者: bahia (bahia)   2019-03-17 00:26:00
其實是使用電子票證的第一百億乘客
作者: abc480528 (Treebase)   2019-03-17 00:52:00
第100億遇到單程票直接下一位遞補就好了吧
作者: mono1023 (阿沛)   2019-03-17 02:47:00
結論是根本測不准吧 會有同時間進站 還有資料進系統的延遲時間
作者: evanzxcv (左蝦餃.易釩斯)   2019-03-17 17:36:00
實務上應該只能從同時第100億人次的那一群人裡面隨機抽
作者: jimmylily (jimmylily)   2019-03-17 22:21:00
推medium好平台~~
作者: ultratimes   2019-03-18 11:52:00
實際上不可能遇到同時進站,只是時間太近可能會超過電腦可以識別的範圍而已就算動作同步到 電視輔助判決都無法看出快慢但只要時間能分割的夠細,還是能看出快慢的兩台一樣的電視 同樣片源 一起撥放 或許一般人無法看出哪台電視延遲的比較多,會覺得都是一起撥放但真的有辦法用高速攝影機去看,一定會有些微落差
作者: lookers (實體店面 貨到付款 宅配)   2019-03-18 15:46:00
作者: mark10133 (TED1010)   2019-03-18 16:19:00
作者: aquarsx3 (長耳跳兔)   2019-03-19 14:05:00
作者: s59654655 (s596546ff)   2019-03-20 12:03:00

Links booklink

Contact Us: admin [ a t ] ucptt.com