工作职责
重点:具有2年以上的项目爬虫经验,最好是国外电商网站的商品数据抓取,有自主搭建IP代理池的技术能力,对防爬取有丰富的对抗经验1. 熟练掌握Python爬虫框架Scrapy;2. 熟练掌握网页抓取原理及正则表达式、XPath、CSS等网页信息抽取技术;3. 熟悉常见的反爬虫机制解决办法(熟悉深度抓取,动态数据获取,模拟登录、代理等技术);4. 熟练调用模拟浏览器进行数据抓取,包括 Selenium 、Puppeteer 、Splash 等;5. 能熟练应对 IP 封禁、参数加密、验证码、字体反爬、人机检测、账号封禁等反爬措施;6. 熟悉SqlServer、mysql、redis等数据库等数据库;7. 熟练掌握网页抓取原理及技术,网页解析过程,具备数据的过滤、清洗、去重、结构化导入经验;8. 熟练使用各类抓包工具,如 Charles 、Fiddler 、Wireshark 等等;
-
重庆林威网络科技…
重庆巴南区万达广场C区10栋6-15
更多工商信息前往天眼查
职位如涉及假招聘、停招、挂着不招人、职位描述与实际情况不符、涉黄涉赌、向求职者收取费用等任一情况。请举报
APP内查看
投递成功
该职位发布,预计招聘3人,近2周已有82人投递:
确定
您的简历中有重要信息尚未完善,可能会影响投递效果。建议完善简历以后,再进行投递~
该企业为假招聘转招生机构,面试时可能会要求参与岗前付费培训,您确定要继续投递简历吗?
投递成功
下载汇博招聘APP接收
面试通知
立即下载
下载汇博招聘APP投递简历
第一时间收到面试通知
下载汇博招聘APP与HR在线直聊
随时沟通,即时回复
最新【数据采集】职位等你查看
使用汇博APP · 第一时间查看最新职位