公務員期刊網 論文中心 正文

互動點播業(yè)務中數據分析技術的應用

前言:想要寫出一篇引人入勝的文章?我們特意為您整理了互動點播業(yè)務中數據分析技術的應用范文,希望能給你帶來靈感和參考,敬請閱讀。

互動點播業(yè)務中數據分析技術的應用

業(yè)務數據分析基本技術介紹

隨著信息技術的發(fā)展以及計算機的數據存儲和處理能力的提升,數據分析技術的應用領域逐漸拓展,各種技術也日趨成熟。目前,在數據挖掘分析技術上已經形成了較為完備的體系,在大多數行業(yè)的業(yè)務數據分析領域已經形成了固定的技術模式。

1數據源準備

數據源是數據分析技術應用的重要前提,數據來源關系到各種業(yè)務分析所需要的數據是否齊全、原始數據質量是否可靠、數據提供的性能方面是否滿足相關要求等。對于不同的行業(yè)領域,數據來源的渠道各不相同,對于數據分析應用而言,也需要在眾多的數據中選取合適的部分進行后續(xù)加工和處理。對于大多數信息化技術應用比較廣泛的企業(yè)而言,主要的業(yè)務運營數據源都可以從自身的信息管理系統中取得,如業(yè)務支撐系統、企業(yè)資源規(guī)劃和管理系統以及流水線作業(yè)信息管理系統等。有部分數據信息是從非常專業(yè)的系統中直接采集到的,如專業(yè)調度系統、電話交換機以及生產線控制系統等。從這些系統中,可以取得企業(yè)運營過程中的基礎信息和關鍵數據,這些數據通常是最能真實客觀地反映企業(yè)運行情況。此外,數據獲取的成本也比較低,穩(wěn)定性和質量比較好,并且易于管理和重構。然而,就經營分析的角度而言,從企業(yè)內部提供的數據還不能滿足全方位分析的需要,需要從企業(yè)外部獲取必要的信息。比如為了深入了解客戶的信息,就需要進行相應的市場調研工作,設計一些調查問卷,搜集與業(yè)務開展和經營相關的重要信息。另外,在某些特定的場合下,還有可能還需要從其它一些外部渠道去集中獲得一些有關客戶和市場的數據信息,目前有不少機構專門從事市場信息數據提供的服務工作。從企業(yè)外部獲得的業(yè)務數據往往是針對性較強,有較高利用價值的信息。但這些信息的真實性、穩(wěn)定性程度就比內部的數據源要低,并且數據獲得的成本相對比較高。

2數據倉庫技術的應用

目前,數據倉庫技術對于大多數經營業(yè)務數據分析任務而言,是必備的基礎條件之一,尤其是對于規(guī)模較大、業(yè)務開展較廣泛的企業(yè)。由于日常運營涉及到的數據來源和種類較多、數據量較大,在進行數據分析處理時需要對原始的信息進行大量的加工處理工作,因此數據倉庫技術的應用就是必然的選擇。應用數據倉庫技術的主要目的是將原始的數據源按相應的要求進行轉換并按專門設計的數據結構進行存儲。數據倉庫技術對原始數據加工處理流程目前一般稱為ETL,即抽取(Extract)、轉換(Transform)和加載(Loading)。抽取過程是指從各類原始的數據源獲取數據的過程,綜合考慮信息系統的處理性能和數據時效性以及分析應用需求等因素,數據抽取過程可以是實時的,也可以是非實時的。對于抽取出的數據需要進行一定的轉換處理,才能夠進行后續(xù)的應用,轉換過程主要是根據后期應用需求將原始的數據進行過濾、異常處理后再進行格式變換、維度調整以及初步分類匯總等處理。數據加載過程就是將處理后的數據裝載到倉庫模型中,并根據應用需求進行數據關聯關系的調整以及性能優(yōu)化。在一些專題分析應用場合,還可以將已經加載至數據倉庫中的數據進行進一步的歸納處理,形成相關主題的數據集市,以提高數據的可用程度。

數據分析方案的設計和實施

數據倉庫建設完成之后,為了實現業(yè)務分析的目標,就可以考慮實施一些數據分析方案,選擇合適的分析方法和工具建立相應的模型,對數據進行處理,最終得到能夠支持業(yè)務經營分析的關鍵信息,這一步對于整個業(yè)務數據分析工作而言是一個關鍵點。數據分析建模工作不僅需要掌握相關分析方法技術,更需要對業(yè)務背景和業(yè)務分析目標有充分的認識。因為數據分析挖掘建模方法沒有嚴格的定律可以遵循,往往需要在實踐中運用一些基本的方法去探索影響業(yè)務目標的關鍵因素,并且需要長期跟蹤業(yè)務發(fā)展情況,不斷地完善模型、調整相關參數,才能夠得到能正確輔助經營決策制定的方案。此外,隨著業(yè)務運營模式的調整和市場環(huán)境的變化,業(yè)務分析模型還可能隨時需要重構并且反復驗證。目前用于數據挖掘分析的方法有很多,從基本的數理統計方法到目前研究比較廣泛的神經網絡、遺傳算法等。但是并不是越復雜的算法效果越好。在很多場合下,應用較為簡便的方法得出的結論更易于描述業(yè)務信息,便于理解以及實踐操作。現在市場上用于進行數據挖掘和統計分析產品也比較豐富,比較典型的分析工具如SPSS、SAS、STAT等,在一些行業(yè)應用領域,還有更加專業(yè)的數據分析工具和軟件包可供使用。在實際運用過程中,可以根據數據分析的需求和應用范圍進行選擇。

互動點播業(yè)務的業(yè)務分析需求

以及數據分析方案設計目前,有線電視運營商在互動點播業(yè)務開展過程中關注最多的經營目標是如何提高用戶對服務的認可程度、擴大用戶規(guī)模、避免用戶流失以及提升用戶的業(yè)務貢獻價值等方面。在這個過程中同時也需要對點播內容的使用情況進行分析,判斷哪些產品的點播頻率比較高,以便進行內容安排方面的調整。為了支撐互動點播業(yè)務經營分析的目標,首先需要初步選擇可能對點播業(yè)務使用頻率影響比較大的一些關鍵性因素,并且判斷哪些信息是有手段可以收集到的,以及從哪些渠道收集等等。這個過程通常需要對基礎業(yè)務有一定的認識,此外還需要對信息數據的分布和管理有相應的了解。通常情況下,對于大多數有線電視運營商而言,目前都在建設和使用業(yè)務支撐系統?;訕I(yè)務分析所需要的基礎信息大多數都可以從業(yè)務支撐系統中獲取,例如從客戶關系管理平臺中可以收集到用戶的基本信息,如客戶名稱、聯系方式、業(yè)務使用的地址等。另外,客戶開通的業(yè)務信息以及訂購的各種產品信息、業(yè)務變更記錄信息以及終端信息等基本上都可以從業(yè)務支撐系統中獲取到。經過一些信息轉換和匯總,我們就可以了解到用戶業(yè)務的在網時間、消費情況、訂購記錄、離網情況等。從這些基本信息里面可以選擇一些業(yè)務上感興趣的因素進行統計分析,以歸納總結出經營分析相關的業(yè)務特征。對于互動點播業(yè)務相關的另外一些信息,如客戶的點播行為記錄,一般就不是直接從業(yè)務支撐平臺上進行采集到。這些數據的來源通常是在互動業(yè)務管理平臺中,用戶在終端上進行點播操作后,互動業(yè)務管理平臺會記錄下與用戶點播操作相關的信息。從這些記錄中,我們可以了解到用戶的點播時間、點播內容、收看時間等等。根據點播的內容,可以在互動業(yè)務內容管理平臺上關聯到其價格、類型、上線時間等信息。綜合上述信息后,就可以整理出互動點播業(yè)務的使用記錄,通過統計分析可以發(fā)現用戶點播的時間、內容偏好和使用量發(fā)展趨勢等數據,這些數據可以幫助判斷系統的容量以及內容的受歡迎程度等信息。最后,為了綜合評估互動業(yè)務的發(fā)展情況,發(fā)現與業(yè)務分析目標關聯較大的一些因素,可以綜合用戶的業(yè)務記錄信息和點播使用情況進行模型構造,并且對結果進行驗證和評估,以得到對決策分析有價值的信息。

互動點播業(yè)務的數據分析方案的實施應用

根據業(yè)務數據分析基本方案設計的思路,可以著手開始實施相應的分析方案。在本文中主要介紹兩類數據分析應用案例,一個是基于基礎點播行為數據進行的統計分析應用,另外一個是根據用戶點播行為數據以及基礎業(yè)務數據綜合分析影響用戶的互動業(yè)務在線情況的因素。

1用戶點播行為數據分析案例

為了了解點播業(yè)務的使用情況,可以根據用戶的點播行為記錄進行數據挖掘分析,以實現總結互動點播內容、時段和使用量趨勢等業(yè)務特征的分析目標。根據方案設計的結論,從互動業(yè)務管理平臺中可以取得這類業(yè)務分析所需要的全部源數據。但是,互動業(yè)務管理平臺中的點播記錄通常全部是以文本記錄的方式保存的,并且由于點播記錄的數量較大,一般按照記錄數量或者時間間隔進行了拆分。為了利用這些信息就有必要進行相應的數據抽取轉換工作。在實際應用中可以使用預先設計的腳本定時從互動業(yè)務管理平臺中進行數據的抽取,然后經過簡單的類型變換后加載至數據倉庫中。為了達到分析目標,主要抽取的信息有產生用戶點播記錄的用戶ID、點播內容的代碼及分類信息、點播的開始和結束時間等等。原始的點播記錄信息轉換后,就可以進行下一步的主題分析準備了,例如可以按照點播的時段、點播的內容,以及用戶區(qū)域等信息進行不同維度的數據分析。圖2是對互動點播類業(yè)務按每日播頻率進行的一個分類統計后用SAS統計工具生成的圖形,在生成統計數據前需要從原始數據中分離出點播時段信息,并行分類匯總。從圖2中可以發(fā)現,點播頻率在一天之中的大致分布規(guī)律。從點播總量上看,每天點播頻率最高的時段是在18:00至22:30左右,峰值在21:00到22:00左右出現,此外在中午12:00左右也有一個高峰時期。點播頻率最低的時段大約在3:00至5:00左右。根據每天點播業(yè)務頻率的分布情況,可以進行相應的網絡容量分析,比如通過業(yè)務高峰數值可以評估出互動點播平臺的并發(fā)容量是否足夠。另外,根據每日點播頻率的分布特征,可以安排相應的業(yè)務運營工作部署。例如在業(yè)務高峰時段可以集中投放一些廣告、通知信息,而一些系統割接和調試工作盡量應安排在使用頻率較低的時段內進行。如果需要了解一些特殊的節(jié)假日的點播頻率分布特征,可以在原始數據中進行重新過濾篩選,生成類似的頻率分布圖并與圖2進行比對,然后分析其特點。從互動業(yè)務點播數據還可以按內容代碼維度進行分析,以統計出與互動視頻節(jié)目內容相關的數據,也可以將不同維度的數據進行組合分析,進一步挖掘出業(yè)務方面感興趣的信息。

2影響互動業(yè)務用戶在線狀態(tài)因素的綜合分析案例

互動業(yè)務經營分析的另外一個重點就是用戶的流失特點分析,其目的在于找到影響用戶在線狀態(tài)的主要因素,并且根據這些信息和目前的業(yè)務狀態(tài)去預測未來一段時間內可能流失的用戶情況。另一方面可以針對影響用戶在線狀態(tài)的主要因素實施有針對性的市場營銷策略,盡可能避免用戶流失情況的產生。此外,在通過分析影響互動在線狀態(tài)的主要因素后,也可以從中發(fā)現進一步發(fā)展擴大用戶規(guī)模的一些線索。為了實現上述業(yè)務目標,首先需要確定分析數據來源。由于是綜合因素分析,首先需要使用業(yè)務支撐系統中用戶的互動業(yè)務狀態(tài)變更信息以及其它一些屬性特征信息。此外,用戶的點播行為數據也是一項重要的數據源,因此也需要引入到模型中。由于最終目的是需要分析影響用戶在線狀態(tài)的主要因素,而在某一個觀測時間點用戶的在線狀態(tài)一般認為是一個二值型的變量,因此可以使用邏輯回歸(logisticregression)方法進行建模。然后將在此時間點前一個時段的用戶點播次數、用戶的在網時長、終端特征等作為自變量。在本案例中,按照某一個時間段內用戶在線狀態(tài)是否發(fā)生變更這一特征,選擇一個用戶的樣本使用SAS軟件的proclogistic過程進行分析。SAS的分析報告中還給出了模型的相關參數以及各變量的參數估計情況。根據分析結果中的卡方值和P值可以了解模型對數據的適配性和穩(wěn)定性。從分析結果給出的參數估計信息中可以了解不同自變量對于互動用戶在線狀態(tài)的影響情況。用戶的點播次數、在線時長以及終端屬性等參數都會影響到用戶的在線狀態(tài)。從參數估計中可以看出點播次數較高的用戶,其流失的比率相對較低,另外使用高清互動終端用戶流失率也相對較低,并且終端類型因素有較高的預測能力。在網時長似乎對用戶的在線情況影響不大,但實際建模的過程中需要考慮套餐贈送的情況,因此最好重新調整參數模型后再進行分析。根據分析的結果可以得出相關的結論,互動用戶的點播頻率越高,其連續(xù)使用的可能性就越大,并且使用高清終端用戶連續(xù)在線的概率比使用標清終端的用戶更大。因此在后續(xù)的分析過程中就可以預測目前點播頻率較低的用戶流失的風險較大,在進行針對性的營銷活動時就可以設法引導用戶更多地進行互動業(yè)務的體驗,并且鼓勵其進行終端升級,以提高這部分用戶在線的概率。當然在分析過程中可能會發(fā)現一些使用頻率非常高的用戶意外流失了,這就值得進一步跟蹤分析,因為很有可能這些用戶選擇了競爭對手提供的類似服務。

結束語

有針對性的經營分析工作對于目前廣泛開展各類增值業(yè)務的有線電視運營商而言顯得非常重要,數據分析技術的應用對于提升企業(yè)業(yè)務分析能力以及制定各類營銷決策而言有較大的促進作用。在運用業(yè)務數據分析技術的過程中,不僅需要對數據分析技術方法本身有足夠的掌握,更重要的是需要深入理解業(yè)務的特點和經營分析目標,并且在實施數據分析方案的過程中累積經驗,對已經建立的分析模型進行調整和優(yōu)化,才能不斷挖掘出對經營決策制定有價值的業(yè)務信息。(本文作者:章鵬、唐月 單位:重慶有線電視網絡有限公司、國家廣電總局廣播電視規(guī)劃院)

相關熱門標簽