Tawn
Massive text de duplication based on simhash algorithm Massive text de duplication based on simhash algorithm
SimHash是一种局部敏感hash,它也是Google公司进行海量网页去重使用的主要算法,本文利用simhash来解决海量文本去重实例问题。
Math Template Math Template
关于数学的一些代码模板
2019-09-27
Dynamic Programming Template Dynamic Programming Template
关于动态规划的一些模板代码
2019-09-27
UVA11212 Editing a Book UVA11212 Editing a Book
一、题目内容【题目描述】 你有一篇n个自然段组成的文章,希望将它们排列成1,2,…,n。可以用Ctrl+X(剪切)和Ctrl+V(粘贴)快捷键来完成任务。每次可以剪切一段连续的自然段,粘贴时按照顺序粘贴。注意,剪贴板只有一个,所以不能连续剪
2019-02-27
HDU1203 I NEED A OFFER! HDU1203 I NEED A OFFER!
一、题目内容【题目描述】 Speakless很早就想出国,现在他已经考完了所有需要的考试,准备了所有要准备的材料,于是,便需要去申请学校了。要申请国外的任何大学,你都要交纳一定的申请费用,这可是很惊人的。Speakless没有多少钱,总共只
2019-02-26
1 / 5