一、主要職責
1.為Scilit數(shù)據(jù)庫進行數(shù)據(jù)倉庫的設計、開發(fā)、維護工作,推動數(shù)據(jù)工程技術棧革新,整合MDPI公司級數(shù)倉體系,構建豐富穩(wěn)定的數(shù)據(jù)資產(chǎn),推動Scilit的數(shù)據(jù)產(chǎn)品化;
2.協(xié)同相關方,將產(chǎn)品/數(shù)據(jù)分析/算法需求轉化為數(shù)據(jù)工程需求,構建數(shù)據(jù)Pipeline和ETL任務,增進相關合作方的數(shù)據(jù)使用便利;
3.建立和提高數(shù)據(jù)模型的準確性、易用性、靈活性、可擴展性,提升查詢效率,為可視化報表開發(fā)、數(shù)據(jù)分析、工程項目和算法開發(fā)等下游數(shù)據(jù)應用提供良好的數(shù)據(jù)條件;
4.承擔大規(guī)模復雜指標的快速計算和維護任務,根據(jù)業(yè)務和數(shù)據(jù)分析需求,開發(fā)、倉儲和維護分析表(寬表),優(yōu)化其查詢效率;
5.收集、清洗、整理Scilit數(shù)據(jù),提升Scilit數(shù)據(jù)質(zhì)量、數(shù)據(jù)可用性和數(shù)據(jù)效率,使得數(shù)據(jù)準確、一致、完整、有效、及時。搭建數(shù)據(jù)質(zhì)量校驗、報警、自動整理機制;
6.建立數(shù)據(jù)字典,將常用維度和指標的技術口徑文檔化。
二、職位要求
1.熟練運用書面和口語英語交流數(shù)倉技術,可以勝任同國際化團隊協(xié)同工作;
2.計算機、信息技術、信息管理、數(shù)據(jù)管理、數(shù)據(jù)科學等相關專業(yè)本科及以上學歷;
3.熟練使用數(shù)據(jù)工程工具,例如:
? SQL類工具,如MySQl和PostgreSQL等
? Python數(shù)據(jù)類工具:如pandas, polars, DuckDB, PyArrow, Great Expectation等
? Data Lake相關工具:Delta Like, Parquet, Amazon S3, Apache Iceberg 等
? Airflow等數(shù)據(jù)調(diào)度工具
4.具備較好的維度建模方法論,獨立負責過數(shù)倉架構設計和優(yōu)化,熟練ETL、數(shù)倉分層、性能調(diào)優(yōu),了解MySQL數(shù)據(jù)庫模型和數(shù)據(jù)結構;
5.熟悉一門或多門面向對象的編程語言:Python/Java/Scala/C ;
6.熟悉從數(shù)據(jù)生產(chǎn)到數(shù)據(jù)消費的全鏈路,具有將技術和優(yōu)秀的業(yè)務理解相結合的能力,發(fā)掘機會、解決問題;
7.兩年以上對口行業(yè)經(jīng)驗,優(yōu)秀者工作年限可適當放寬;
8.邏輯清晰嚴謹,對數(shù)據(jù)敏感,跨團隊協(xié)作能力、溝通能力強。
加分項:
? 熟悉以下技術:
* PHP Symfony
* 元數(shù)據(jù)管理,如DataHub
* 圖數(shù)據(jù)庫和圖數(shù)據(jù)分析
* 其它:Apache Solr, Shell, Git
* Streamlit
* Docker
? 有學術出版、文獻計量學和科學計量學、作者消歧等相關知識、技能和經(jīng)驗;
? 了解數(shù)據(jù)分析/機器學習/NLP,或有將數(shù)據(jù)分析/算法和業(yè)務洞察能力結合的經(jīng)驗。
三、薪資福利
1. 薪酬待遇:30-45K;
2. 基礎福利:六險一金,帶薪年假,年度體檢,節(jié)日福利,活動經(jīng)費,豐富茶歇,營養(yǎng)晚餐等;
3. 進階福利:子女福利,團隊獎勵,培訓津貼,崗位津貼;
4. 職業(yè)發(fā)展:導師培養(yǎng),技能培訓,管理培訓。
四、辦公地點
北京市通州區(qū)觀音庵北街4號院保利大都匯T2寫字樓10層
乘車路線:地鐵6號線-通州北關站C口,步行600米
求職提示:用人單位發(fā)布虛假招聘信息,或以任何名義向求職者收取財物(如體檢費、置裝費、押金、服裝費、培訓費、身份證、畢業(yè)證等),均涉嫌違法,請求職者務必提高警惕。
-
媒體·出版·文化傳播
-
1000人以上
-
私營·民營企業(yè)
-
北京市海淀區(qū)中關村南四街18號紫金數(shù)碼園4號樓201室

應屆畢業(yè)生
本科
最近更新
506人關注
注:聯(lián)系我時,請說是在四川人才網(wǎng)上看到的。
