重复:您如何推荐实施标签或标记

标签系统(例如帖子或照片)的高效,快速和优雅架构是什么。例如,您有一个像StackOverflow这样的网站,每个项目都有几个标签。什么是跟踪这些并使其可搜索的最佳方式。可伸缩性也很重要。


每个项目都有一个“标签”列。因此,在该项目行的数据库中,您拥有包含所有标签的字符串" tag1 tag2 tag3 keyword anothertag etc“。然后,您可以在该列上允许全文搜索索引。


有一个标签表。它映射“tag”的地方:“item_id”。这样可以更快地搜索...您可以搜索tag = keyowrd并获取所有item_id的列表。


这两个看起来都是明显的解决方案,但是对于非常大的数据集来说,这似乎是一种非常低效的方法。有任何实现标记系统的想法或其他方法吗?

有帮助吗?
许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top