我需要开发一个用于Web日志数据挖掘的工具.
在特定用户会话中请求的许多网址序列(从网络应用程序日志中检索),我需要弄清楚网站用户的使用模式和组(群集).
我是Data Mining的新手,现在正在检查Google.
找到一些有用的信息,即查询Frequent Pattern Mining in Web Log Data似乎指向几乎完全相似的研究.
所以我的问题是:
>是否有任何基于python的工具可以满足我的需要或者至少相似?
> Orange toolkit可以提供任何帮助吗?
>可以阅读这本书 Programming Collective Intelligence有什么帮助吗?
> Google的内容,阅读内容,使用哪种相对简单的算法?
我的时间非常有限(到一周左右),所以任何帮助都会非常珍贵.我需要的是指出我正确的方向和如何在最短的时间内完成任务的建议.
提前致谢!
解决方法:
1& 2:Orange具有频繁的模式挖掘模块.它还支持群集.
我刚刚查看了这本书的内容.频繁模式挖掘没有章节.无论如何,对于数据挖掘的初学者来说,它通常是一本好书.您将发现帮助您精确定义问题非常有用.
4.您需要了解群集的输入和输出,频繁模式挖掘/关联规则挖掘.所以google这些算法,或者找一本好的数据挖掘教科书来阅读.
标签:python,data-mining 来源: https://codeday.me/bug/20190627/1299855.html
本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享; 2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关; 3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关; 4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除; 5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。