爬虫工程师

¥面议 远程全职
爬虫工程师
职位描述

 你是我们要找的人吗? 我们在构建一个颠覆信息封锁的系统,正在挑战传统平台对数据的垄断。

如果你曾经: • 手撸过绕过五层反爬机制的爬虫

• 和 headless browser 、fingerprint spoofing 、proxy pool 、captcha farm 等黑科技打过交道

• 喜欢和 CDN 、WAF 、GraphQL 、JS 渲染斗智斗勇

• 干过一些不方便放在简历上的爬虫活儿

那你大概率是我们的人。

———

 我们在干什么? 我们正在做一套“人员智能数据采集网络”系统,用于获取世界上最敏感、最闭塞、最商业价值极高的数据源。目标直指 LinkedIn 、PitchBook 、人才库、企业注册信息、暗网索引等高墙数据源。

———

 你需要具备的技能 • 精通 Python ,熟悉 scrapy / playwright / selenium / puppeteer 等任意一家

• 对 JS 渲染、异步加载、Cloudflare 、anti-bot headers 有深入理解

• 能够使用代理池、账号池、cookie pool 、UA rotation 等机制绕反爬

• 有防 ban / 动态调度 / 分布式爬虫系统经验优先

• 熟悉 MongoDB / ElasticSearch / Postgres 等数据存储系统优先

———

 加分项(不是硬性要求) • 写过自己的分布式爬虫框架

• 用过 Tor / 代理 IP 供应商 / browser fingerprint control

• 喜欢“信息猎取”和 OSINT

• 曾参与过合法 or 边缘合法的数据战役(你懂的)

———

 我们提供什么? • 真正有挑战性的技术问题,不是 CRUD 系统

• 不设限的发挥空间(我们会为你配资源,而不是约束)

• 初创公司早期 equity (我们已经拿到顶级 VC 投资)

• 一群你聊技术聊得尽兴的队友(我们不请普通人)

———

最后提醒一句 如果你曾经梦想在键盘上打败过 LinkedIn 、ZoomInfo 、PitchBook 、Apollo 、Crunchbase —— 我们正在召集这种人。

爬虫不是工具,是一门艺术。

我们要的是能破解系统的人,而不是“调接口”的人。