APP如何給用(Use)戶打标簽+内容推送?

發布時(Hour)間: 2020-07-02 信息來(Come)源:河南互傳網絡科技有限公司 浏覽:1261次

什麽是内容興趣偏好标簽呢?

  簡單來(Come)說就是分析用(Use)戶喜歡看的(Of)文章類型,得到(Arrive)用(Use)戶的(Of)興趣偏好,在(Exist)這(This)樣的(Of)基礎上,對用(Use)戶進行内容的(Of)個(Indivual)性化推薦和(And)push推送,來(Come)有效促進app的(Of)活躍并拉長用(Use)戶生(Born)命周期。

  這(This)件事情簡單來(Come)說其實就是兩步走:

  一(One)是,給文章進行分類,也就是我(I)們俗稱的(Of)給文章打标簽。

  二是,給用(Use)戶打标簽,也就是用(Use)戶閱讀了哪些類型的(Of)文章,相應的(Of)就會獲取到(Arrive)自己的(Of)興趣偏好标簽。

  那麽在(Exist)實際操作(Do)中真的(Of)如此簡單嗎?看似簡單的(Of)兩個(Indivual)環節,究竟是如何實現的(Of)呢?

  一(One)般情況下有三種方式獲取樣本:

  一(One)是人(People)工對文章進行标注,優點是準确,缺點是效率低,對于(At)算法要(Want)求大(Big)量樣本的(Of)要(Want)求,成本非常高。

  而另一(One)種方式則是通過一(One)些開源網站提供的(Of)關鍵詞進行模型訓練,比如可以(By)從搜狗詞庫獲取,優點是成本低,但缺點也很明顯,由于(At)不(No)同的(Of)分類體系對部分分類的(Of)理解不(No)一(One)緻,導緻分類并不(No)夠準确,後期需要(Want)耗費大(Big)量的(Of)人(People)力進行矯正。

  第三種方式是和(And)一(One)些資訊類app進行合作(Do),獲取他(He)們的(Of)文章以(By)及分類作(Do)爲(For)樣本,例如目前做的(Of)比較好的(Of)如今日頭條、uc等都是不(No)錯的(Of)選擇。我(I)們當時(Hour)其實都嘗試了(一(One)把辛酸淚)。

  獲取樣本以(By)後,就是算法模型的(Of)訓練及其檢驗了。算法模型的(Of)訓練原理,即通過對樣本文章進行分詞,抽取實體,建立特征工程,将每一(One)個(Indivual)特征詞作(Do)爲(For)向量,拟合出(Out)一(One)個(Indivual)函數,這(This)樣,當有新的(Of)文章時(Hour),該文章通過分詞,并通過模型計算出(Out)結果。但模型并不(No)是能夠有樣本一(One)次性就能準确的(Of),模型還需要(Want)進行測試和(And)矯正。

馬上開啓軟件定制服務

立即體驗