有人用大數據“殺熟”,她們卻用大數據做了我市軌道交通客流分析,運用自己設計的算法,對軌道交通出站人數的預測平均精準率達到了93%。昨日,在第33屆重慶市青少年科技創新大賽上,南開中學三位高二女生的研究項目獲得了一等獎。
擠地鐵 擠出來這個課題
譚婧懿、韋沐汐、唐睿詩是南開中學高二年級的學生,雖然三人不在同一班上,但她們都有一個共同的愛好,參加科技創新活動。說起這次參加重慶市科技創新大賽,譚婧懿有些不好意思,“這個選題,還是我們上學放學擠地鐵擠出來的。”
原來,三位女生經常坐1號線。
“每天早上上學和放學回家乘坐軌道交通會這么擁擠?根本就擠不進去啊!”“如果有方法能夠迅速疏散客流,為市民提供快捷、舒適的出行服務,那該多好!”
三個人你一言,我一語,就把選題給定了下來。
找數據 一站就是3小時
確定了選題,就開始找數據。“她們用了最笨但也是最實在的辦法,就是高峰、平峰兩個時間段,到地鐵站數人。”指導老師楊夢寧說。
“我們三個人,一人數出站人數,一人數進站人數,一人看車廂的擁擠程度。”唐睿詩說,雖然大家有分工,但一天數下來,“是真累,好想帶個小板凳坐下,好想吃個面包充饑。那段時間真是太累了,回去就不想動,放空自己。”放學后、假期里,在地鐵1號線的沙坪壩站,三位小女生成了常客。還因為長時間站在那里,不少人以為她們是志愿者,“好多來問路的。”
付出總是有回報,數了一段日子后,孩子們在自己整理的記錄上,發現了一些規律,“我們通過這些數字中的規律,再找到負責部門要了一些數據,做后期的研究。”
做分析 手算一個月才處理兩個星期數據
拿到了海量數據,就要做分析找規律。因為之前沒有做過類似的課題,三位女生又用到了最原始的方法,把數據錄入到EXCEL里“手算”。“因為數據要錄入,還要排版,這樣‘手算’了一個月,才處理兩個星期的數據,這樣不是辦法。”楊夢寧說。
于是孩子們運用多種算法對數據進行計算,“最開始,預測精準率只有60%,后來加入其他算法,提升到70%以上。但她們拿著這樣的結果給運營部門看時,他們說精準率在80%以上,才算有點意義。”在深度學習算法后,“我們再把空間特征轉化為時間特性來進行計算,平均精準率就達到了93%。”譚婧懿說。
“我們的創新主要是將軌道交通的空間信息引入到客流預測中,同時引入了兩種不同的時間信息,即歷史同期序列與順序時間序列,并將其結合,形成新的特征組。除此之外,還將時空特征進行結合引入到客流預測中,將空間特征以及時間特征歷史共同結合來創建模型,能更準確全面地進行客流預測。”三個女生的這一項目不僅獲得了一等獎,目前也正在申請相關的專利。
(新媒體責編:wb001)
聲明:
1、凡本網注明“人民交通雜志”/人民交通網,所有自采新聞(含圖片),如需授權轉載應在授權范圍內使用,并注明來源。
2、部分內容轉自其他媒體,轉載目的在于傳遞更多信息,并不代表本網贊同其觀點和對其真實性負責。
3、如因作品內容、版權和其他問題需要同本網聯系的,請在30日內進行。電話:010-67683008
人民交通24小時值班手機:17801261553 商務合作:010-67683008轉602
Copyright 人民交通雜志 All Rights Reserved 版權所有 復制必究 百度統計 地址:北京市豐臺區南三環東路6號A座四層
增值電信業務經營許可證號:京B2-20201704 本刊法律顧問:北京京師(蘭州)律師事務所 李大偉
京公網安備 11010602130064號 京ICP備18014261號-2 廣播電視節目制作經營許可證:(京)字第16597號