基于乘客需求的站務管理平臺系統(tǒng)設計研究
0 引言
站務管理平臺的設計與開發(fā)離不開對乘客需求的分析和挖掘,北京地鐵熱線是北京地鐵與乘客之間的重要溝通渠道,每年都會積累大量乘客留言信息,這些信息往往會暴露出運營過程中存在的不足,并可進一步發(fā)掘出乘客的潛在服務需求。因此,對于乘客需求的挖掘,將有助于精確地定位站務管理平臺系統(tǒng)的功能,使系統(tǒng)更加符合乘客的實際需要。
從現(xiàn)有文獻可知,對于乘客的需求挖掘方法,通常采取乘客調(diào)研的方式——請乘客填寫調(diào)研問卷或進行訪談,這種方法的優(yōu)點是獲取的信息較為全面,缺點是需求挖掘不夠深入,并且由于調(diào)研問題的限制,一些需求點容易被忽略。通過乘客建議文本挖掘乘客需求是對乘客調(diào)研的補充和替代,乘客主動提出的建議能夠反映出乘客真實可靠的需求。
1 乘客需求挖掘關鍵技術
本文通過主題模型方法對乘客需求進行挖掘。首先,將乘客建議文本由非結(jié)構(gòu)化數(shù)據(jù)通過文本預處理方法轉(zhuǎn)變?yōu)榻Y(jié)構(gòu)化的數(shù)據(jù),并去除掉停用詞及干擾詞,生成分析語料;其次,將語料導入到主題模型當中,生成主題分類結(jié)果及主題關鍵詞;最后,通過領域經(jīng)驗根據(jù)關鍵詞生成最終分類結(jié)果。
1.1 LDA模型
LDA(Latent Dirichlet Allocation)主題模型由David M Blei提出,屬于自然語言處理中主題挖掘的典型模型,是基于概率圖的三層貝葉斯概率生成模型。LDA主題模型的主要思想是假設文檔集中的每個文檔均由多個主題混合而成,每個主題是固定詞表上多個詞匯的多項式分布,目的在于采用高效的概率推斷算法處理大規(guī)模數(shù)據(jù),從文本語料庫中抽取潛在的主題,提供一種量化研究主題的方法。該方法目前已經(jīng)被廣泛應用到各類主題發(fā)現(xiàn)中,如熱點挖掘、主題演化、趨勢預測等。
LDA模型認為文檔是由權(quán)重相同的詞語可以用矩陣分解的形式表現(xiàn)出來,通過矩陣分解可以構(gòu)造出LDA的概率模型。也就說LDA模型可以通過圖1左邊的矩陣進行訓練,學習得出右邊2個矩陣。
圖1 LDA模型的矩陣形式
在向量空間中,任何語料(文檔的集合)可以表示為文檔(Document - Term,DT)矩陣。表1的矩陣表達了1個語料庫的組成:
表1 語料矩陣
W1 | W2 | Wn | ||
D1 | 0 | 2 | 3 | |
D2 | 1 | 4 | 0 | |
Dn | 1 | 1 | 0 |
其中,N個文檔D1,D2,…Dn的組成語料庫,M個詞W1,W2,…Wm組成詞匯表。矩陣中的值表示了詞Wj在文檔Di中出現(xiàn)的頻率,同2時,LDA將這個矩陣轉(zhuǎn)換為2個低維度的矩陣:M1和M。
表2顯示了M1矩陣的情況,它是N×K大小的 document-topic 矩陣,N指文檔的數(shù)量,K指主題的數(shù)量,M1中,是一個長度為k的向量,用于描述當前文檔在k個主題上的分布情況,Z表示具體的主題。
表2 語料矩陣
Z1 | Z2 | Zn | ||
0 | 2 | 3 | ||
1 | 4 | 0 | ||
1 | 1 | 0 |
表3顯示了M2矩陣的情況,它是K×V維的topic-term矩陣,K指主題的數(shù)量,V指詞匯表的大小。M2中每一行都是1個分布,也就是主題在m個詞上的多項式分布情況,可以通過學習得到。
表3 語料矩陣
W1 | W2 | Wn | ||
0 | 2 | 3 | ||
1 | 4 | 0 | ||
1 | 1 | 0 |
1.2 LDA建模流程
基于LDA的文本主題建模包括文本數(shù)據(jù)導入、建立語料詞典、形成詞袋模型和詞頻數(shù)據(jù)類型、設置主題建模參數(shù),主題建模流程見圖2。
圖2 LDA主題建模流程
1.3 乘客建議文本預處理
本文共收集了2018年北京地鐵乘客熱線留言5 000 條,在進行乘客需求挖掘之前,先對原始文本數(shù)據(jù)進行預處理,將文本的半結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)變?yōu)榻Y(jié)構(gòu)化數(shù)據(jù)。需要對原始文本數(shù)據(jù)進行去重、分詞和和過濾停用詞處理。
1)原始文本數(shù)據(jù)去重
由于乘客建議文本數(shù)據(jù)存在著重復記錄的問題,對于后續(xù)的文本分析會造成一定的干擾,所以需要對原始數(shù)據(jù)進行去重操作。
2)文本分詞
分詞階段就是對每個文本進行中文分詞,詞性標注,并且使其結(jié)果按照規(guī)定的格式輸出。本研究采用Jieba分詞算法,分詞精度高,其中基于角色標注的新詞識別的召回率高于90%,詞性標注、分詞處理速度達到543.5 kB/s。
(3)過濾停用詞
因為在分詞階段所得到的詞集中,有很多詞是無實際意義的,這些無實際意義的詞對分析工作的影響可以忽略不計,但如果將這些無實際意義的詞作為文本特征詞,往往會給文本分類結(jié)果帶來較大的誤差,通常本文將這些詞稱為停用詞。所以就需要在正式的文本分析前,對這些停用詞進行過濾。
1.4 語料主題建模結(jié)果
主題建模結(jié)果包含了多個主題,主題數(shù)量由參數(shù)設置決定。每個主題又包含了多個主題詞和主題詞的權(quán)重,權(quán)重代表主題詞屬于該主題的概率。根據(jù)關鍵詞參數(shù)的設置,結(jié)果按照權(quán)重的大小排序,篩選出該主題下可能的主題詞??偨Y(jié)出乘客需求挖掘的主題類型如表4所示。
表4 乘客需求主題類型及關鍵詞
主題類型 | 主題名稱 | 特征詞 |
Topic 1 | 標志標識 | 標識、線路圖、提示、附圖、信息 |
Topic 2 | 乘車安全 | 乞討、車門、摔倒、夾到、賣藝、治理 |
Topic 3 | 站車服務 | 態(tài)度、吸煙、嬉笑打鬧、手機 |
Topic 4 | 客運組織 | 進展、安檢、限流、高峰、盲道、刷卡、候車、圍欄、排隊、換乘、擁堵 |
Topic 5 | 溫控噪音 | 溫度、通風、空調(diào)、悶熱、冷氣、暖風 |
Topic 6 | 設施設備 | 漏水、電梯、扶梯、維修、檢修、閘機、故障 |
Topic 7 | 運營時間 | 間隔時間、發(fā)車、縮短、晚點、首班車 |
Topic 8 | 站車衛(wèi)生 | 異味、保潔員、很臟、通風口、漏水、油污、衛(wèi)生間 |
根據(jù)乘客熱線留言的主題模型挖掘,分析出乘客的乘車的需求包括:
1)具有方便乘車并快速準時到達目的地的需求,如導向標識清晰、列車時刻表準確等,包括Topic 1、Topic 4和Topic 7。
2)具有乘車全流程中保證人身安全的需求,如設備運行穩(wěn)定、人員安全等,包括Topic 2、Topic 6
3)具有在乘車的全流程中保持舒適的需求,如地鐵工作的人員的服務態(tài)度良好、服務技能達標、環(huán)境適宜等,包括Topic 3、Topic 5和Topic 8。
2 基于乘客需求的站務管理平臺系統(tǒng)設計
根據(jù)乘客的上述需求,站務管理要從乘客的基本乘車需求、安全需求、服務需求三方面出發(fā),進行相應工作安排。對于站務管理平臺系統(tǒng)設計也應從這三方面著手,配合站務管理工作。因此,對于站務工作人員提出了如下的工作需求:
1)始終保持對車站的整體態(tài)勢的持續(xù)感知功能,對車站運行狀態(tài)的全面掌握,對突發(fā)時間的及時響應,需要囊括的數(shù)據(jù)包括車站的環(huán)境信息、客流量信息、列車到站時間和站內(nèi)設備運行狀態(tài)等;
2)對于站內(nèi)的各個系統(tǒng)設備進行巡檢、管理維護,及時對設備故障進行維修,并完善設備維護和故障維修記錄;
3)對站務工作人員持續(xù)地進行業(yè)務培訓,保持工作人員良好的服務態(tài)度,不斷提升業(yè)務技能;
4)合理的進行工作計劃安排,保持車站業(yè)務運行順暢,提高站務人員的工作效率;
5)對乘客提出的問題要記錄和匯總,并及時做出改進和反饋;
6)對車站的物資的合理化管理、運用和分配。
針對上述站務工作人員的業(yè)務需求,提出了相應的站務管理平臺系統(tǒng)框架,如圖3所示。
圖3 站務管理平臺系統(tǒng)架構(gòu)
1)感知層
基于對于地鐵站內(nèi)的態(tài)勢感知需求,需要不同的傳感器獲取站內(nèi)設備的數(shù)據(jù),了解設備的運行狀態(tài);不同的系統(tǒng)接口,獲取票務、電力、環(huán)控等系統(tǒng)的數(shù)據(jù)進行綜合分析;統(tǒng)一的通訊協(xié)議,在不同系統(tǒng)之間傳遞數(shù)據(jù)和指令,使地鐵站內(nèi)不同的系統(tǒng)結(jié)合程有機的整體,協(xié)調(diào)發(fā)揮作用。
2)業(yè)務層
根據(jù)站務工作的需要,結(jié)合感知層獲得的數(shù)據(jù),構(gòu)建工作管理、巡檢管理、設備故障報修、員工培訓、數(shù)據(jù)管理和臺賬管理六大功能。通過這六個業(yè)務管理模塊,協(xié)助站務人員完成業(yè)務需求。
3)終端設備層
站務管理平臺系統(tǒng)實現(xiàn)了臺式機、平板電腦和手機的跨平臺建設,打破傳統(tǒng)管理信息系統(tǒng)桌面端的限制,實現(xiàn)桌面端和移動端數(shù)據(jù)的共享,賦予站務人員移動辦公能力,提高業(yè)務處理效率。
4)用戶層
站務管理平臺系統(tǒng)主要使用者包括站務領導、站務工作人員和系統(tǒng)管理員。系統(tǒng)管理員負責維護系統(tǒng)保持系統(tǒng)的正常運行;站務領導主要通過系統(tǒng)進行工作安排,并通過系統(tǒng)數(shù)據(jù)掌握站務工作進展;站務工作人員通過系統(tǒng)接收各種工作任務,并通過系統(tǒng)將工作中的產(chǎn)生的數(shù)據(jù)反饋到系統(tǒng)中來。三類用戶根據(jù)崗位職責不同,擁有不同的系統(tǒng)權(quán)限。
3 結(jié)語
區(qū)別與傳統(tǒng)的信息系統(tǒng)需求設計,本文并非單純挖掘系統(tǒng)使用者的業(yè)務需求,而是進一步分析系統(tǒng)使用者的服務對象,從服務對象需求的角度推演出系統(tǒng)使用者的需求,使系統(tǒng)設計更加符合實際需要。本文利用主題模型方法,對地鐵乘客熱線的留言文本進行分析,挖掘出8種乘客乘車常見的問題,匯總出乘客準時到達目的地、安全和舒適的3種需求,并推演出站務工作者對地鐵站態(tài)勢感知的需求,對自身業(yè)務技能和服務態(tài)度提升的需求,對于地鐵站設備故障及時維修的需求,對工作計劃科學合理安排的需求,對乘客問題及時改進和反饋的需求,和對車站物資合理管理的需求,并根據(jù)以上需求設計出適合地鐵站務工作的管理信息系統(tǒng)。
參考文獻:
[1] 鄭大威,馬琳,燕飛.地鐵設備智能維修管理研究及展望[J].都市快軌交通, 2018 (5): 32.
[2] 肖雄,陳朝暉,何華強.智慧地鐵車站移動站務管理系統(tǒng)的設計與研究[J].通訊世界,2020(1):25.
[3] 謝美麗,張欣環(huán),吳金洪,等.基于模糊綜合評價法的杭州地鐵乘客滿意度評價[J].交通與運輸,2020,36(02):78-81.
[4] 劉建榮,周毅镕,祝旭乾.基于Rasch模型的地鐵服務質(zhì)量研究[J].武漢理工大學學報(交通科學與工程版),2019,43(04):580-584.
[5] 黃體允,夏妞,李秋健,等.基于乘客出行滿意度的地鐵換乘方案優(yōu)化[J].價值工程,2020,39(08):27-28.
[6] 吳剛勇,張千斌,吳恒超,等.基于自然語言處理技術的電力客戶投訴工單文本挖掘分析[J].電力大數(shù)據(jù),2018,21(10):68-73.
[7] 劉興平,章曉明,沈然,等.電力企業(yè)投訴工單文本挖掘模型[J].電力需求側(cè)管理,2016,18(2):57-60.
[8] 廉素潔.基于文本分類和情感評分的電信投訴文本挖掘研究[D].杭州:浙江工商大學,2018.
(本文來源于《電子產(chǎn)品世界》雜志社2020年12月期)
評論