抖音的推薦機(jī)制抖音的秘密武器!
抖音的推薦機(jī)制是大家都想要了解的奧秘,特別是對(duì)做內(nèi)容創(chuàng)作的人來(lái)說(shuō),今天我們將要看看抖音的推薦機(jī)制究竟是怎么工作。
抖音的推薦機(jī)制系統(tǒng)推薦介紹
實(shí)時(shí)推薦系統(tǒng)需要強(qiáng)大的數(shù)據(jù)作支撐(包括數(shù)據(jù)的收集和儲(chǔ)存),用以支持相對(duì)抽象的層面(包括算法層面、服務(wù)層面和應(yīng)用程序?qū)用?,從而解決業(yè)務(wù)方面的問(wèn)題。
抖音的推薦系統(tǒng),簡(jiǎn)單來(lái)說(shuō)就是“以用戶(hù)為中心”。換句話(huà)說(shuō),抖音只會(huì)推薦用戶(hù)喜歡的內(nèi)容,從剛剛上手的用戶(hù)到活躍的用戶(hù)都是如此——當(dāng)然,用戶(hù)越是活躍,推薦的內(nèi)容也就更加精準(zhǔn)。
在抖音的工作系統(tǒng)中,有三個(gè)主要的板塊:(1)用戶(hù)標(biāo)記內(nèi)容(2)創(chuàng)建用戶(hù)的肖像及使用場(chǎng)景(3)訓(xùn)練機(jī)器學(xué)習(xí)算法。
抖音的推薦機(jī)制的數(shù)據(jù)與功能
內(nèi)容數(shù)據(jù)。用戶(hù)在使用抖音的過(guò)程中留下了大量的內(nèi)容數(shù)據(jù),這些數(shù)據(jù)可以被用來(lái)分類(lèi)、歸類(lèi),方便日后更加精準(zhǔn)的推薦。
用戶(hù)數(shù)據(jù)。這種數(shù)據(jù)包括用戶(hù)在抖音上留下的各種標(biāo)簽、職業(yè)、年齡、性別等。
場(chǎng)景數(shù)據(jù)。這一類(lèi)數(shù)據(jù)是關(guān)于用戶(hù)使用場(chǎng)景的數(shù)據(jù)。比如,在上下班、旅行的時(shí)候,用戶(hù)分別喜歡看哪一類(lèi)的視頻。
關(guān)聯(lián)功能。這類(lèi)功能包括根據(jù)標(biāo)簽推薦、關(guān)鍵詞搜索、標(biāo)簽分類(lèi)、資源搜索、主題標(biāo)簽等等。
用戶(hù)-場(chǎng)景重現(xiàn)功能。這類(lèi)功能是基于場(chǎng)景數(shù)據(jù)(包括用戶(hù)的地理坐標(biāo)、時(shí)間表、事件的標(biāo)簽)等重現(xiàn)用戶(hù)觀看視頻的場(chǎng)景。
協(xié)同功能。簡(jiǎn)單來(lái)說(shuō),這類(lèi)功能不僅會(huì)分析單個(gè)用戶(hù)留下的數(shù)據(jù),還會(huì)分析相似的用戶(hù)組的數(shù)據(jù)(包括點(diǎn)擊的內(nèi)容、興趣、關(guān)鍵詞、主題)。
通過(guò)上述模型,這款應(yīng)用程序?qū)㈩A(yù)測(cè)某些視頻在某些具體的場(chǎng)景中是否適合某位用戶(hù)。
抖音推薦算法
推薦系統(tǒng)的成長(zhǎng)過(guò)程可以被視為機(jī)器學(xué)習(xí)的典型例子。然后通過(guò)算法(包括過(guò)濾模型、回歸模型等)將整個(gè)推薦機(jī)制加以完善。
產(chǎn)業(yè)化的推薦系統(tǒng)需要靈活且可以拓展的ML平臺(tái),可以允許多種模型疊加起來(lái),時(shí)時(shí)刻刻為用戶(hù)服務(wù)。
除了主要算法之外,抖音的推薦系統(tǒng)還要根據(jù)用戶(hù)肖像制定特殊的算法,具體的算法系統(tǒng)有層級(jí)分類(lèi)。
在抖音上,每天都有數(shù)百萬(wàn)的用戶(hù)上傳自己的視頻。有一些不符合規(guī)定的視頻很可能會(huì)逃過(guò)單一的審核系統(tǒng)。
一般來(lái)說(shuō),Duo-Audit模型可以識(shí)別視頻圖像和關(guān)鍵字。它主要有兩個(gè)功能:(1)檢查視頻中是否有違法違規(guī)的內(nèi)容(包括圖像和文案),一旦有相關(guān)內(nèi)容,系統(tǒng)會(huì)將該條視頻標(biāo)注成黃色和紅色,留到后期再由人工審核(2)通過(guò)提取視頻中的關(guān)鍵幀,可以將其與存檔內(nèi)容進(jìn)行對(duì)比,減少審核時(shí)所消耗的流量,同時(shí)減少引擎的負(fù)擔(dān)。
當(dāng)上傳的內(nèi)容在雙重審核下通過(guò)之后,它將被放入到啟動(dòng)池中。
投放進(jìn)流量池后,視頻可以獲得數(shù)千次觀看,和視頻相關(guān)的數(shù)據(jù)也會(huì)被收集和分析。比如獲贊數(shù)量、觀看數(shù)量、完整的觀看數(shù)量、評(píng)論、關(guān)注者數(shù)量、轉(zhuǎn)發(fā)數(shù)量、分享數(shù)量等等。
經(jīng)過(guò)上一個(gè)步驟,用戶(hù)的反饋將成為一條視頻是否可以獲得更多曝光的標(biāo)準(zhǔn)。我們將介紹一個(gè)用戶(hù)肖像放大機(jī)制。換句話(huà)說(shuō),優(yōu)秀的視頻內(nèi)容將在特定的用戶(hù)組(比如球迷、時(shí)尚愛(ài)好者)中得到更多的曝光。這是一種類(lèi)似于“猜您喜歡什么”的概念。通過(guò)用戶(hù)留下的各類(lèi)數(shù)據(jù),抖音可以建立用戶(hù)的個(gè)人資料庫(kù),從而在內(nèi)容和用戶(hù)間進(jìn)行更好的搭配。
在上述步驟重復(fù)一段時(shí)間后,抖音將篩選出少于1%的優(yōu)秀內(nèi)容投放到趨勢(shì)池(Trending Pool)中。在這個(gè)區(qū)域,內(nèi)容的曝光率將會(huì)比其他區(qū)域的曝光率都要高,因?yàn)檫@些被認(rèn)為是優(yōu)質(zhì)內(nèi)容的視頻會(huì)被無(wú)差別地推薦給所有用戶(hù)。
多久可以判定自己的視頻沒(méi)有流量了?
抖音有一個(gè)叫g(shù)ravedigger的算法,可以回顧舊的視頻內(nèi)容,從中挑選并曝光高質(zhì)量的視頻。在這種算法的曝光下,一些優(yōu)秀內(nèi)容最終會(huì)被發(fā)掘出來(lái)。
潮流效應(yīng):如果你的某條內(nèi)容獲得了數(shù)百萬(wàn)的觀看率,那么它就會(huì)固定在你的個(gè)人頁(yè)面上。比如如果你專(zhuān)門(mén)發(fā)貓貓的視頻,其中一條的觀看率尤其高,那么這一條就會(huì)固定在你的個(gè)人頁(yè)面上,而省去了其他相似的、關(guān)注度不那么高的視頻。
據(jù)了解一條視頻的曝光時(shí)間很短,短到只有短短只有一周,一周之后沒(méi)有流量的話(huà)就可以放棄這個(gè)視頻了。