ICode9

精准搜索请尝试: 精确搜索
首页 > 编程语言> 文章详细

python – 如何做相关问题自动填充

2019-07-10 11:09:05  阅读:128  来源: 互联网

标签:python algorithm django information-retrieval


我想在我的应用程序中获得一个相关的[事物/问题],类似于StackOverflow所做的,当你跳出Title字段时.

我只能想到一种方法,我认为可能足够快

>在所有[事物]的标题语料库中搜索标题,并返回前x个匹配项.我们可以使用用于网站搜索的任何搜索.

有什么其他方法可以做到这一点,这些方法足够快,因为这将在tabout上发送,因此大型服务器端处理对它来说是不可行的.

我只是想找到这样做的方法,但是我使用的是mysql和DJango,所以如果你的答案使用它,那就更好了.

[我想不出好的标签,所以请随意编辑它们]

解决方法:

您正在研究基于内容的推荐算法. AFAICT StackOverflow会查看标题中的标签和单词,并找到共享其中一些内容的问题.它可以在文档表示为TF-IDF vectors的空间中实现为最近邻搜索.

在实现方面,与任何支持词干,停用词,非严格匹配和tf-idf权重的Django搜索引擎一起使用.算法复杂度不高(只是几个索引查找),所以如果它是用Python编写的并不重要.

如果您没有找到您想要的搜索引擎,请将词干和停用词留给搜索引擎,在单个词上调用搜索引擎,并使用有利于类似标记的分数进行自己的tf-idf评分.

标签:python,algorithm,django,information-retrieval
来源: https://codeday.me/bug/20190710/1423318.html

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有