ICode9

精准搜索请尝试: 精确搜索
首页 > 其他分享> 文章详细

个人项目-论文查重

2021-09-19 23:33:22  阅读:172  来源: 互联网

标签:查重 0.8 30 20 个人 论文 算法 txt orig


个人项目:论文查重

gitHub地址

软件工程
作业要求 作业要求链接
作业目标 完成论文查重项目,进行测试并使用Github进行版本发布及源码和测试用例管理

一、PSP表格

Personal Software Process Stages 预估耗时(分钟) 实际耗时(分钟)
Planning 计划
· Estimate · 估计这个任务需要多少时间 360 660
Development 开发 120 165
· Analysis · 需求分析 (包括学习新技术) 120 120
· Design Spec · 生成设计文档 10 15
· Design Review · 设计复审 20 25
· Coding Standard · 代码规范 (为目前的开发制定合适的规范) 30 35
· Design · 具体设计 30 40
· Coding · 具体编码 80 95
· Code Review · 代码复审 25 30
· Test · 测试(自我测试,修改代码,提交修改) 50 60
Reporting 报告
· Test Repor · 测试报告 10 25
· Size Measurement · 计算工作量 20 20
· Postmortem & Process Improvement Plan · 事后总结, 并提出过程改进计划 20 30
· 合计 535 660

二、模块接口的设计与实现过程

2.1 项目结构

1632056121700

主要类

simhash算法实现类:

1632056774348

余弦相似度算法实现类:

1632056857252

Unit类

算法原理

采用simhash算法来计算文本相似度,需要计算得到汉明距离

1632057520341

最后由公式img,将汉明距离带入x即可计算出文本相似度

算法流程

三、模块结构接口部分的性能改进

内存、CPU、GC、线程情况

Live Memory

CPU Load

堆内存

四、计算模块部分单元测试展示

代码

测试结果:

代码覆盖率

异常处理

代码

异常测试

五、测试结果

orig_0.8_add.txt 0.9739645582549769
orig_0.8_del.txt 0.8055412527550833
orig_0.8_dis_1.txt 0.9973557010035817
orig_0.8_dis_10.txt 0.682243394533814
orig_0.8_dis_15.txt 0.682243394533814

标签:查重,0.8,30,20,个人,论文,算法,txt,orig
来源: https://www.cnblogs.com/tqlbcqr/p/15313188.html

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有