为客户专业定制网络爬虫,定向抓取网络数据.
自建有分布式爬虫系统,主服务器部署于多个国家,并有约千台匿名代理服务器,能高效准确的为客户定制化的从各种网站、手机应用抓取所需数据,并进行数据清洗和结构化处理。
擅长数据抓取,机器学习,自然语言处理等技术,面向中小企业提供快速明晰的商务数据挖服务。
我们用于数据处理的主要技术工具有:
数据抓取: scrapy
数据挖掘: numpy, scipy, matplotlib, pandas(R替代)
机器学习: scikit-learn, libsvm
自然语言处理: nltk