更新于 4月17日

中高級(jí)python爬蟲工程師

2-3萬
  • 北京石景山區(qū)
  • 5-10年
  • 本科
  • 全職
  • 招2人

職位描述

Python反爬蟲分布式爬蟲ScrapyJS DEBUGGERJS 逆向SeleniumDRISSIONPAGEAPP脫殼APP逆向反編譯人工智能
崗位職責(zé): 1.對(duì)指定的網(wǎng)站進(jìn)行網(wǎng)頁抓取、數(shù)據(jù)提取、破解反爬策略; 2.負(fù)責(zé)多平臺(tái)信息抽取、數(shù)據(jù)清洗、入庫、服務(wù)化等研發(fā)和優(yōu)化工作; 3.參與開發(fā)和設(shè)計(jì)分布式網(wǎng)絡(luò)爬蟲系統(tǒng),進(jìn)行信息的抓取和分析工作; 4.研究優(yōu)化爬蟲算法,提升爬蟲系統(tǒng)的穩(wěn)定性、可擴(kuò)展性; 5.獨(dú)立解決實(shí)際開發(fā)過程中碰到的各類產(chǎn)品數(shù)據(jù)需求和接口問題。 任職資格: 1、本科及以上學(xué)歷,計(jì)算機(jī)相關(guān)專業(yè),5年以上工作經(jīng)驗(yàn)。 2、精通python編程語言,熟悉scrapy等常用數(shù)據(jù)抓取框架以及原理,熟悉網(wǎng)頁信息和APP數(shù)據(jù)抽取,能夠設(shè)計(jì)分布式爬蟲系統(tǒng)框架; 3、精通 Charles等抓包工具,精通網(wǎng)頁抓取原理及技術(shù),精通正則表達(dá)式,熟練從結(jié)構(gòu)化和非結(jié)構(gòu)化的數(shù)據(jù)中獲取信息; 4、精通 JS debugger、JS逆向; 5、精通 selenium 、DrissionPage 等自動(dòng)化抓取技術(shù); 6、把握網(wǎng)絡(luò)爬蟲核心技術(shù)研究方向,研究優(yōu)化算法,提升爬蟲系統(tǒng)的穩(wěn)定性、可擴(kuò)展性; 7、研究爬蟲策略和防屏蔽規(guī)則,解決封賬號(hào)、封IP、驗(yàn)證碼、頁面跳轉(zhuǎn)等難點(diǎn)攻克,提升網(wǎng)頁抓取的效率和質(zhì)量 8、優(yōu)先條件,對(duì)APP脫殼、APP逆向反編譯或者有快手、抖音數(shù)據(jù)爬取經(jīng)驗(yàn),或者對(duì)機(jī)器學(xué)習(xí)算法有一定了解。

工作地點(diǎn)

北京石景山區(qū)六工匯-F1號(hào)樓

職位發(fā)布者

高健/HR

剛剛活躍
立即溝通
北京大享科技有限公司
北京大享科技有限公司是一家從事技術(shù)開發(fā),技術(shù)推廣,技術(shù)轉(zhuǎn)讓等業(yè)務(wù)的公司,成立于2018年03月26日,公司坐落在北京市,企業(yè)的經(jīng)營范圍為:技術(shù)開發(fā)、技術(shù)推廣、技術(shù)轉(zhuǎn)讓、技術(shù)咨詢、技術(shù)服務(wù);計(jì)算機(jī)系統(tǒng)服務(wù);基礎(chǔ)軟件服務(wù)、應(yīng)用軟件服務(wù);軟件開發(fā);軟件咨詢;產(chǎn)品設(shè)計(jì);數(shù)據(jù)處理,公司致力于為企業(yè)提供先進(jìn)的解決方案和技術(shù)服務(wù)。
公司主頁