該內容將在AI Institute合作夥伴Pandata的許可下重新發布。BETVlCTOR1946伟德
推薦係統是像Spotify這樣的公司根據您的偏好向您提出建議的AI類型。這是他們的工作方式...
首先,我們需要從建議係統配方的成分開始。推薦係統使用三件事來提出建議。
他們需要一些建議。在推薦術語中,這些被稱為項目。項目可以是我們希望客戶製作的聯係人,我們希望客戶購買的東西或我們希望客戶完成的活動。
推薦人還需要有關用戶,我們正在提出建議的人。具體來說,他們需要有關用戶對我們推薦的項目的感覺的數據。我們通過評分以及用戶如何與項目進行交互,稱為顯式和隱式信息, 分別。我們將稍後再討論。
第三組信息是可選的,但通常用於推薦係統最複雜的信息。這是有關用戶或用戶如何與該項目交互或感覺的信息。這可以包括諸如愛好,技能,用戶的朋友網絡之類的東西。這就是所謂的側麵信息這些類型的數據通常在社交網絡的推薦係統中找到。您在建議中包含的側麵信息取決於建議係統的目標。
用戶與項目的互動產生兩種類型的數據 - 說明信息和隱式信息。
明確的信息包括星級等級或喜歡和不喜歡的內容。這些是用戶用來明確表示對該項目的看法的東西。通常,我們沒有可用的明確信息,我們必須推斷用戶對用戶行為項目的感覺。
這是隱式信息所在的地方。暗示對某個項目的興趣的行為,例如單擊以獲取更多信息,保存項目或購買,用於創建有關用戶對項目的感覺的最佳猜測。隱性信息需要做出可能對行為和觀點之間關係不正確的假設,但是研究表明,這些類型的數據產生了可靠的建議。
隱式,明確和側麵信息的組合用於創建所謂的輪廓對於每個用戶。這些配置文件是推薦係統如何提出建議的關鍵。不同類型的推薦係統以不同的方式使用這些配置文件。
推薦係統有兩種主要類型,稱為內容過濾器和協作過濾器。兩個過濾器之間的主要區別是他們使用配置文件創建建議的方式。
內容過濾器專注於識別與用戶對用戶配置文件中出現的評分或與用戶進行評分或交互的項目。這些類型的推薦係統依賴於確定我們喜歡的項目與我們從未體驗過的項目之間的類似特征。在此示例中,白色條紋的藍調,朋克後的車庫Alt-Rock聲音將此用戶連接到具有相似聲音的組。這種建議者的優勢在於它標識了我們已經喜歡的事物的特征。弱點是,我們可以提出許多建議,這些建議太過了,就像我們已經經曆過或購買的那樣,而且不足的新物品。
協作過濾器使用用戶配置文件來識別配置文件相似的其他用戶。一旦確定了一組類似的用戶,該算法就可以找出其他用戶不包含的其他用戶。這個想法是,如果我們與其他用戶分享口味,那麼他們可能建議的東西(他們喜歡的東西)將為我們提出好建議。協作過濾器的建議可能包含我們以前從未經曆過的新事物。他們還可以向我們展示我們不太感興趣的東西。
一些推薦人將內容和協作過濾器的優勢結合在一起混合過濾器。有很多方法可以創建混合過濾器,從而為建立推薦係統的選擇提供聚寶盆。
沒有一個尺寸適合製造推薦係統的方式。從您使用的組件到構建的過濾器類型的所有內容都取決於推薦係統的目標。因此,下次您打開自己喜歡的音樂應用程序時,請考慮一下您與播放列表的互動方式,收聽的歌曲以及您分享的有關自己的信息可能已將您連接到其他類似口味的聽眾,並引導了算法在白色條紋之後玩中風。