与统计学相比,基于内容来向用户推荐相似的内容,往往更容易获得。对于推荐来说,则有两种方式:
- 手动推荐
- 自动推荐
手动推荐。在技术领域,作者通常比大多数读者更专业,他们往往知道什么是读者需要的。如,你看了一个 React 相关的文章,你可能会需要 Redux 相关的内容。
自动推荐。需要一些前提条件:融合现有系统的数据信息,获取一些用户的信息。随后,再计算出相关的内容,最后返回给读者。
而在这篇文章里,我们将介绍 :
- 标签生成的方式
- 基于手动标签推荐
- 半自动的标签推荐
- 全自动的基于内容推荐
标签生成
文章与我们平时使用的物品,有很大的不同之处。如手机,拥有固定的 规格参数,价格、屏幕尺寸、运行内存(RAM)、机身内存、CPU、后置摄像头像素、前置摄像头像素等等,我们可以轻易地通过这些特征,了解用户大概需要什么东西。如果用户浏览的是 2880 的 某 pro 7 手机,那么某米 6 的手机可能更适合该用户。
而文章是一种 非结构化的数据,除了作者、写作日期这一类的信息,我们很难直接描述其特性,也就难以判定文章之间是否是相似的。因此,我们就需要从文章中抽取出关键词,或称为标签,从而判断出用户喜欢的是某一种类别。
对于使用标签来向用户推荐产品的应用
原文: 如何为技术博客设计一个推荐系统(中):基于 Google 搜索的半自动推荐
更多精彩内容,欢迎搜索并关注我的微信公众号: Phodal