服务热线:0755-26162999
求职通二维码
人才热线提示每一位求职者:若用人单位存在提供虚假招聘信息、发布虚假招聘广告,以担保或者其他任何名义向求职者收取财物(如办卡费、押金、培训费),扣押或以保管为名索要身份证、毕业证及其他证件等行为,均属违法,请您提高警惕并注意保护个人信息!!
爬虫及数据工程师
  • 薪资面议
  • /本科以上
  • /经验2年以上
  • /2人
  • /全职 兼职 应届毕业生
  • /英语
广东 深圳
2017-09-21更新
举报
职位描述

工作职责:
1.编写大规模分布式网络爬虫(多线程、分布式调度、协议处理);
2.系统解决动态网页内容抓取、深度网页内容抓取的关键技术;
3.机器学习,信息检索,大规模数据挖掘等工作;
4.负责大数据高性能分布式处理系统的开发
5.数据清洗整理类产品的应用开发、优化;
6.构建和开发在海量数据下多维分析的数据分析平台

职位要求:
1.Java基础扎实,精通SSH等开源框架;
2.熟悉MySql、Oracle、MongoDB一种或多种数据库开发技术,有较好的数据库设计能力;
3.精通网页抓取原理及技术、深度抓取、动态网页技术抓取、浏览器模拟抓取技术,从结构化的和非结构化的数据中获取信息;
4.精通爬虫和反爬技术,精通http底层协议;精通深度抓取、动态网页技术抓取、浏览器模拟抓取技术等;
5.熟悉分布式系统、多线程
6.具有网络爬虫、网页信息抽取、数据挖掘、自然语言处理、信息检索、机器学习、web挖掘等搜索引擎等相关经验优先;
7.计算等相关专业,本科学历,两年及以上经验

申请职位
其他信息
手机app
  • 手机找工作
  • 更轻松 更便捷
  • 下载手机APP发现机会
相似职位

邮件发送该职位

职位信息发送给以下收件人:

您的邮箱地址(必填):

邮件发送成功

已成功将该职位发送给位收件人

订阅成功

订阅失败

您的订阅已超过上限,如需继续订阅,请在 订阅管理 中至少停用1条订阅。

收藏夹已满

您尚未登录,最多可在本机收藏5个职位。更多跨平台收藏请 登录
您也可以将职位 发送到邮箱

合并收藏成功

我们已经将您在未登录时收藏的5个职位合并到收藏夹。

举报该职位
请填写您的姓名
验证码不正确
提交

使用微信“扫一扫”
打开网页后点击右上角“分享按钮