扫一扫,访问微社区
只需一步,快速开始
使用道具 举报
原帖由 gyCai 于 2008-11-7 16:11 发表 看你短信多长了。 假设70个字符一条短信,那就hash计数,外加扫描冒泡留下前面10个。 开销最大的是1kw*70=700M字符串的值hash计算了。
原帖由 kids 于 2008-11-9 18:55 发表 第二个:排序 qsort o(nlogn) 10^7*lg10^7 在统计一下,不会超过5分钟 一分钟都不用 第三:https://www.gdutbbs.com/thread-262473-1-1.html 可以按协议排,再按区域网络排,再按网站名排 ...
原帖由 DieIng 于 2008-11-19 21:18 发表 字符串的排序很慢的。nlgn*length(s)。。。。 第三个如果是http://aaa0aaa.com和htap://aaa0aaa.com的话。相似度极其高。你的算法会把他们分开的
本版积分规则 发表回复 回帖并转播 回帖后跳转到最后一页
用微信扫一扫互动赢积分
|Archiver|手机版|小黑屋|广告业务Q|工大后院 ( 粤ICP备10013660号 )
GMT+8, 2025-5-13 04:53
Powered by Discuz! X3.5
Copyright © 2001-2024 Tencent Cloud.