1、输入为单个或多个网站域名,从词库中选取词组(包括排除词、动词、形容词、名词和其他),输出为中标的疑似URL及网页摘要;
2、处理过程包括网站页面数据获取、分析处理及报表三大模块,处理的数据仅限文字,建议采取模块开发;
3、对监控词组设置请参考附件,本项目最核心程序包括爬虫效率及页面过滤分析算法效率,最终结果以准确率和时间效率来衡量;
4、为便于筛选合适的投标方,一期只要求对单个网站中所有网页页面标题对其分析检索即可,项目金额4000元。二期要求分析网页页面内容,项目金额12000元。
接包方 | 国家/地区 | |
---|---|---|
4
Chenrongye
|
北京市 | |
2
Mhz1600
(中标)
|