崗位職責:
1.參與研究院數據庫的整體設計、模型構建、技術選型與持續優化;
2.負責ETL(抽取、轉換、加載)流程的開發、測試、上線與性能優化。熟練掌握大數據處理框架(如Hadoop、Spark、Flink),進行數據計算、清洗、整合與挖掘工作;
3.負責數據質量管理、元數據管理及數據全生命周期管理,分析并解決數據相關問題,確保數據的準確性、一致性與安全性;
4.深入理解業務需求,將業務問題轉化為數據解決方案。協助設計數據產品、可視化工具或分析報告,為業務決策提供數據支持;
5.針對特定任務進行需求分析,實現基礎原型系統的設計開發;
6.完成領導交辦的其他工作。
任職要求:
1.碩士及以上學歷,應屆生需博士學歷;計算機、通信等相關專業;熟練掌握SQL語言,深入理解數據庫事務、索引、鎖等核心機制。具有至少一種主流關系型數據庫(如MySQL、PostgreSQL)和一種大數據存儲組件(如HBase、ClickHouse、Doris)的實際操作經驗;
2.至少精通C/C++、Python或JAVA中的一門編程語言,具備良好的編碼習慣和工程能力。熟悉Hadoop、Spark、Flink等大數據生態組件,有實際開發或調優經驗者優先;
3.具備數據挖掘、機器學習算法基礎,能夠使用Python及相關庫(如Pandas, NumPy, scikit-learn)進行數據分析、建模者優先;
4.擁有3年及以上大數據開發、數據倉庫建設或數據庫工程相關工作經驗的優先考慮;有能源、電力、工業物聯網或智慧城市相關行業大數據項目經驗者將獲得重點考慮;
5.具備出色的邏輯分析能力、問題解決能力和技術攻關能力;
6.善于溝通,能夠清晰理解業務需求并與跨職能團隊協作;
7.擁有強烈的責任心、主動學習能力和抗壓能力,能適應快速發展的技術環境。