协同过滤：如何确定每个用户的产品隐式分数？

题

在实现了推荐产品的算法并取得了一些成功之后，我现在正在寻找计算该算法的初始输入数据的方法。

我的目标是计算用户有某种历史记录的每个产品的分数。

我目前正在收集的数据：

所有这些数据都带有时间戳。

我正在寻找一些建议，理想情况下这个问题应该更多地进行讨论，而不是寻求单一的“正确”答案。

为了避免这个问题因错误的答案而脱轨，一旦我获得了每个用户的数据，我就会做以下事情：

基本上，我并不是在寻找一旦我做什么的想法有输入数据（稍后我可能需要进一步的帮助，但这不是这个问题的重点），只是为了了解如何首先生成此输入数据

解决方案

这是一个干草的回应：

你们销售什么类型的产品？这可能有助于我们更好地回答您。（因为这是一个老问题，所以我正在向 @Andrew Ingram 和任何其他有相同问题并通过搜索找到此线程的人提出问题。）

其他提示

您可以允许用户明确说明他们的偏好，就像 Netflix 允许用户指定星级一样。
您可以为他们购买的所有商品分配一个正数值，因为您说您确实有他们的购买历史记录。为他们没有买的东西分配零
你可以对他们购买的东西进行某种加权，并根据流行情况进行调整。（如果几乎每个人都购买了某种产品，那么它并不能告诉您有关他们也购买了该产品的人的更多信息）请参阅 “词频-逆文档频率”
您还可以为用户查看但未购买的商品分配一些较小的数值。

许可以下： CC-BY-SA 和归因