服务热线:0755-26162999
求职通二维码
人才热线提示每一位求职者:若用人单位存在提供虚假招聘信息、发布虚假招聘广告,以担保或者其他任何名义向求职者收取财物(如办卡费、押金、培训费),扣押或以保管为名索要身份证、毕业证及其他证件等行为,均属违法,请您提高警惕并注意保护个人信息!!
  • 薪资面议
  • /大专以上
  • /经验3年以上
  • /2人
  • /全职
  • 五险一金
  • 企业年金
  • 餐饮补贴
  • 提供工作餐
  • 年终奖金
  • 年底双薪
  • 专业培训
  • 带薪年假
  • 员工旅游
  • 定期体检
广东 东莞
2019-12-09更新
举报
东莞莞城查看地图
职位描述

岗位职责:
1、负责信息抓取,结果的抽取、数据清洗、分类、聚类等工作;
2、负责数据抓取平台规划和建设,完成数据采集与爬取、解析处理和入库;
3、研究各种网页探寻特点和规律,负责网页信息抽取、数据清洗工作;
4、负责领域知识的定向爬取、深度提取和挖掘;
5、配合数据清洗、整理、去重和合并工作;
6、设计爬虫策略与算法,提升抓取效果;
7、负责爬虫相关技术的创新和优化。
 
任职要求:
1、全日制大专以上学历,计算机相关专业,3年以上爬虫领域工作经验;
2、精通网页抓取原理及技术、正则表达式、动态数据抓取、防屏蔽等关键技术;
3、使用PHP语言进行爬虫
4、熟悉TCP/IP、HTTP、HTTPS等网络协议,熟悉web前端,可读懂js/css/html等代码;
5、熟悉MySql/PostgreSQL/MongoDB/Redis等常用数据库或缓存的一种;
6、熟悉反爬机制,能够通过逆向js脚本,获取参数,熟悉使用正则表达式/验证码加密处理/代理池,熟悉行为验证码识别、模拟登陆。

申请职位
其他信息
手机app
  • 手机找工作
  • 更轻松 更便捷
  • 下载手机APP发现机会
相似职位

邮件发送该职位

职位信息发送给以下收件人:

您的邮箱地址(必填):

邮件发送成功

已成功将该职位发送给位收件人

订阅成功

订阅失败

您的订阅已超过上限,如需继续订阅,请在 订阅管理 中至少停用1条订阅。

收藏夹已满

您尚未登录,最多可在本机收藏5个职位。更多跨平台收藏请 登录
您也可以将职位 发送到邮箱

合并收藏成功

我们已经将您在未登录时收藏的5个职位合并到收藏夹。

举报该职位
请填写您的姓名
验证码不正确
提交

使用微信“扫一扫”
打开网页后点击右上角“分享按钮