公務(wù)員期刊網(wǎng) 論文中心 正文

提升音樂(lè)推薦系統(tǒng)性能構(gòu)想探討

前言:想要寫(xiě)出一篇引人入勝的文章?我們特意為您整理了提升音樂(lè)推薦系統(tǒng)性能構(gòu)想探討范文,希望能給你帶來(lái)靈感和參考,敬請(qǐng)閱讀。

提升音樂(lè)推薦系統(tǒng)性能構(gòu)想探討

摘要:本文從用戶(hù)的聽(tīng)歌數(shù)據(jù)入手,通過(guò)數(shù)據(jù)預(yù)處理技術(shù)提取相關(guān)特征,利用FP-tree算法得到歌曲之間的關(guān)聯(lián)規(guī)則;在此基礎(chǔ)上,利用DBSCAN聚類(lèi)算法將歌曲根據(jù)其本身屬性進(jìn)行聚類(lèi),找到同類(lèi)歌曲。最終把兩者有機(jī)結(jié)合,互相補(bǔ)充,使新的推薦系統(tǒng)發(fā)揮更加理想的功能。

關(guān)鍵詞:歌曲;FP-tree;關(guān)聯(lián)規(guī)則;聚類(lèi);推薦系統(tǒng);DBSCAN

一、推薦系統(tǒng)簡(jiǎn)介

談起推薦系統(tǒng)首先要從個(gè)性化推薦談起。個(gè)性化推薦是根據(jù)用戶(hù)的興趣特點(diǎn)和購(gòu)買(mǎi)行為,向用戶(hù)推薦其感興趣的商品和服務(wù)。隨著電子商務(wù)規(guī)模迅速擴(kuò)大,商品數(shù)量和種類(lèi)急速增長(zhǎng),顧客需要花費(fèi)大量時(shí)間才能找到自己想買(mǎi)的商品。這種瀏覽大量無(wú)關(guān)信息和產(chǎn)品的過(guò)程會(huì)給用戶(hù)帶來(lái)極大的不便,從而導(dǎo)致消費(fèi)者不斷流失。為了解決這些問(wèn)題,個(gè)性化推薦系統(tǒng)應(yīng)運(yùn)而生。本文主要研究大數(shù)據(jù)在音樂(lè)推薦系統(tǒng)中的應(yīng)用。通過(guò)一些挖掘算法,發(fā)現(xiàn)數(shù)據(jù)之間的相關(guān)性,預(yù)測(cè)用戶(hù)喜歡的歌曲類(lèi)別以及更加具體的特點(diǎn)構(gòu)建用戶(hù)畫(huà)像,快速準(zhǔn)確推測(cè)使用者的喜好,及時(shí)為用戶(hù)推薦更多感興趣的信息、數(shù)據(jù)及鏈接,以達(dá)到方便用戶(hù)吸引消費(fèi)者的目的。

(一)推薦系統(tǒng)現(xiàn)狀和弊端

現(xiàn)在商業(yè)智能平臺(tái)上信息量呈爆炸式發(fā)展,但數(shù)據(jù)本身所具有的規(guī)模巨大和不穩(wěn)定性,對(duì)人們?nèi)绾螠?zhǔn)確迅速提取出有價(jià)值的信息,仍具有不可忽視的制約作用。比如,實(shí)際上喜歡聽(tīng)流行歌曲的用戶(hù),因參與合唱活動(dòng)反復(fù)聽(tīng)了一些經(jīng)典革命歌曲,使軟件在他結(jié)束合唱活動(dòng)后,仍然繼續(xù)推薦大量經(jīng)典老歌,導(dǎo)致出現(xiàn)不符合用戶(hù)需求的情況。這就是由于推薦系統(tǒng)數(shù)據(jù)處理系統(tǒng)過(guò)于僵化造成的不良后果。所以,推薦系統(tǒng)還有很多方面的技術(shù)需要優(yōu)化升級(jí)。

(二)優(yōu)化升級(jí)推進(jìn)系統(tǒng)的創(chuàng)新點(diǎn)

在設(shè)計(jì)推薦系統(tǒng)過(guò)程中,如果強(qiáng)化數(shù)據(jù)預(yù)處理技術(shù),并采用關(guān)聯(lián)規(guī)則與聚類(lèi)算法相結(jié)合的方法,則會(huì)盡最大可能地避免推薦系統(tǒng)僵化的問(wèn)題。1、強(qiáng)化優(yōu)化數(shù)據(jù)預(yù)處理功能。在用戶(hù)選擇的歌曲中,并非都是用戶(hù)所喜愛(ài)的,所以,需要將數(shù)據(jù)先進(jìn)行簡(jiǎn)單處理。在用戶(hù)選擇過(guò)的歌曲中,將播放時(shí)間短于總歌曲時(shí)長(zhǎng)60%的歌曲剔除;2、采用關(guān)聯(lián)規(guī)則與聚類(lèi)算法相結(jié)合的方法。聽(tīng)歌是一種較為個(gè)性的行為,單使用關(guān)聯(lián)規(guī)則推薦,會(huì)導(dǎo)致推薦范圍過(guò)于寬泛,沒(méi)有針對(duì)性;單使用同屬性歌曲推薦,會(huì)使用戶(hù)永遠(yuǎn)無(wú)法嘗試新的歌曲,無(wú)法了解與自己類(lèi)似愛(ài)好用戶(hù)的選擇。所以把兩者有機(jī)結(jié)合,互相補(bǔ)充,才能使新的推薦系統(tǒng)發(fā)揮更加理想的功能。使用關(guān)聯(lián)規(guī)則是從每一位用戶(hù)出發(fā),挖掘聽(tīng)了“a”歌曲的人同時(shí)聽(tīng)的其它相關(guān)歌曲,形成“a”的關(guān)聯(lián)規(guī)則。這樣就可以在后續(xù)推薦中,為聽(tīng)了“a”歌曲的人推薦與“a”相關(guān)的其他歌曲。使用聚類(lèi)算法是對(duì)歌曲的各項(xiàng)屬性進(jìn)行區(qū)別。各項(xiàng)屬性包括節(jié)奏、發(fā)行時(shí)間、語(yǔ)言和情感等。在實(shí)際情況中,用戶(hù)的喜好都是獨(dú)特的,不能單純的依靠其他用戶(hù)的選擇來(lái)推測(cè),這樣就可以做到,為聽(tīng)過(guò)“a”歌曲的用戶(hù)推薦與其屬于同一類(lèi)別的歌曲。

二、實(shí)際應(yīng)用

(一)關(guān)聯(lián)規(guī)則FP-tree的應(yīng)用

在進(jìn)行關(guān)聯(lián)規(guī)則分析時(shí),以每個(gè)用戶(hù)在一個(gè)時(shí)間段的聽(tīng)歌情況為一個(gè)元組。值得注意的是,用戶(hù)點(diǎn)擊的歌曲并非都是他喜歡的,首先需要對(duì)其進(jìn)行預(yù)處理,把用戶(hù)聽(tīng)了一小部分就直接跳過(guò)的歌曲直接清除,進(jìn)而排除異常值對(duì)最終結(jié)果的影響。首先,設(shè)定最小支持度閾值為50%,最小置信度閾值為75%,將每一位用戶(hù)的每一首歌按照遞減的支持度排序,并構(gòu)造FP-tree。從樹(shù)根處的節(jié)點(diǎn)向上尋找路徑,挖掘頻繁項(xiàng)集。例如,從h處向上的路徑只有一條且支持度小于最小支持度閾值,所以沒(méi)有包含歌曲h的頻繁項(xiàng)集。在歌曲h挖掘完成后對(duì)其它歌曲用此方式挖掘FP-tree。從d向上兩條路徑中發(fā)現(xiàn){c,d}支持度為50%和在歌曲c中置信度75%,滿(mǎn)足條件。從歌曲c向上尋找路徑,可發(fā)現(xiàn){a,c}也為頻繁項(xiàng)集,支持度為75%,歌曲c中置信度為75%。通過(guò)FP-tree算法,我們得到頻繁項(xiàng)集{a,d},{a,c}。

(二)DBSCAN聚類(lèi)算法的應(yīng)用

第二組數(shù)據(jù)是以一首歌為元組,包括歌曲的各個(gè)量化的自身屬性。用DBSCAN算法,每一個(gè)點(diǎn)代表一首歌,使數(shù)據(jù)聚類(lèi)成簇,對(duì)歌曲進(jìn)行分組。在實(shí)際情況中,一首歌曲的屬性多種多樣,有節(jié)奏快慢、發(fā)行時(shí)間、傳達(dá)的情緒等等,每一個(gè)屬性決定著一個(gè)維度,他們構(gòu)成多維數(shù)據(jù)。屬性種類(lèi)越廣泛,越齊全,得到的結(jié)果也將越精確。本次實(shí)驗(yàn)將其簡(jiǎn)化為二維,僅用節(jié)奏快慢和發(fā)行時(shí)間的數(shù)據(jù)進(jìn)行聚類(lèi)。這兩類(lèi)數(shù)據(jù)在去除單位后的數(shù)值上有差異,并不方便進(jìn)行比較和處理。因此,要把數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理。通過(guò)該聚類(lèi)算法得到歌曲分類(lèi)為{a,c,g,h}、{b,d},其中,{f},{e}可算作噪聲點(diǎn)。

(三)兩類(lèi)算法結(jié)果綜合分析的應(yīng)用

假設(shè)用戶(hù)聽(tīng)了歌曲c,要對(duì)該用戶(hù)推薦歌曲,綜合結(jié)果如下:從上面兩種方法中得到的兩個(gè)關(guān)于c的結(jié)果,分別是關(guān)聯(lián)規(guī)則{a,c}和同類(lèi)歌曲{a,c,g,h},再將兩個(gè)集合取并集,根據(jù)受歡迎程度(本次只按照點(diǎn)擊量表示)將歌曲分別排序,推薦并集內(nèi)熱度高的歌曲。

三、音樂(lè)推薦系統(tǒng)拓展延伸

(一)音樂(lè)社交

音樂(lè)推薦系統(tǒng)與音樂(lè)交流平臺(tái)相結(jié)合。把音樂(lè)推薦軟件可以搭建在音樂(lè)交流平臺(tái)上,讓獲得相同或類(lèi)似推薦的用戶(hù)參與交流和分享,讓最受青睞的歌曲及時(shí)得到分享,最大限度地發(fā)揮音樂(lè)推薦系統(tǒng)的作用。

(二)音樂(lè)與天氣

音樂(lè)推薦與地域天氣相結(jié)合。使喜歡關(guān)注天氣預(yù)報(bào)的人,能方便的看到自己喜歡的音樂(lè)歌曲,使喜歡歌曲的人也能隨時(shí)觀察到他需要的天氣情況。天氣也是影響用戶(hù)聽(tīng)歌的重要因素,把歌曲的特點(diǎn)與天氣影響人們情緒變化規(guī)律的特點(diǎn)恰當(dāng)?shù)亟Y(jié)合起來(lái),在推薦歌曲時(shí),根據(jù)該地區(qū)的天氣預(yù)報(bào)選擇歌曲。例如,在下雨天推薦舒緩溫柔的歌曲,天氣晴朗時(shí)推薦活潑歡快的歌曲,在炎熱的夏天推薦清爽宜人的音樂(lè)歌曲。

四、結(jié)束語(yǔ)

推薦系統(tǒng)作為大數(shù)據(jù)的重要應(yīng)用正在日新月異地發(fā)展創(chuàng)新,推薦系統(tǒng)可以由點(diǎn)到線,再由線拓展到面,繼續(xù)呈扇面擴(kuò)展開(kāi)來(lái),進(jìn)而形成功能巨大的發(fā)散型推薦系統(tǒng),使其信息數(shù)據(jù)和服務(wù)范圍涵蓋音樂(lè)、圖書(shū)、影視、日常百貨以及所有商品,為用戶(hù)提供越來(lái)越全面、推薦更加精準(zhǔn)化人性化的服務(wù),實(shí)現(xiàn)企業(yè)商家效益最大化的目的。

參考文獻(xiàn):

[1]JiaweiHan,MichelineKamber,JianPei數(shù)據(jù)挖掘概念與技術(shù),機(jī)械工業(yè)出版社

[2]張良均,楊坦等,《MATLAB數(shù)據(jù)分析與挖掘?qū)崙?zhàn)》,北京:機(jī)械工業(yè)出版社,2015年6月

[3]周英,卓金武等,《大數(shù)據(jù)挖掘系統(tǒng)方法與實(shí)例分析》,北京:機(jī)械工業(yè)出版社,2016年4月

作者:楊雯珺 單位:山東省實(shí)驗(yàn)中學(xué)

相關(guān)熱門(mén)標(biāo)簽