[RD] 網站可靠性工程師 Site Reliability Engineer (hybrid)

薪資範圍:NT$ 1,500,000 - 2,000,000 (年薪)

公司名稱: 慧景科技thingnario

【必要條件】- SRE 相關內容三年以上工作經驗- 具開發雲端 Linux / Docker / K8s 資料流系統叢集(GCP / AWS / Azure,GCP為佳)- 具備大型 NoSQL 資料庫維運經驗(Elasticsearch, InfluxDB 為佳)- 精通 Linux 系統負荷衡量標準與工具(如:Prometheus、Grafana、Kibana)- 了解 資料結構、演算法、作業系統、網路架構等基礎知識- 了解 Design Pattern、Clean Code、Clean Architecture 等概念- 熟 Python、Javascript,能夠透過 callstack 去 trace code 找到問題的根源 - 負責單日數億筆電力時序資料的雲端 AIoT 基礎架構、應用架構的維運- 協同 Data、Fullstack 等團隊,維護日常服務。如:定期的 SLI / SLO 分析、系統性事件的根解、系統效能的改進,協同規劃與執行新功能導入- 協同 Data、Fullstack 等團隊,開發並維護 CI / CD、測試環境與測試系統- 服務指標的優化或開發。如:服務可用度量測、API 響應時間監測、系統健康度評估- 效能指標的優化或開發。如:前後端元件效能指標選定,指標異常偵測- 系統維運與建立自動化。如:系統異常偵測與災後恢復機制、系統升級與版本控制、建立高可用性系統等【技術挑戰與成長】- thingnario 已經站穩台灣太陽能 AIoT 軟體監控系統的地位,除了海內外市場正在快速成長以外,我們也持續在能源行業裡面開拓新的產品線。以目前單日收集處理電力資料上億筆、歷史總管理資料超過 100 TB 的情況下,面對下一個 10 倍量級的事情準備是一件不容易的事。如何從系統穩定的角度,以數據化 SLI / SLO 的方式,帶動自身與團隊的成長,以回應我們成為世界級軟體公司的渴求,將是我們對您的期待。- thingnario的研發團隊多數都對各自的技術能力有不小的自我要求,並且保持著互相理性討論的開放文化,以追求彼此的快速成長。我們歡迎對於技術有熱衷的朋友,加入 thingnario 一起學習、成長、變強。【關於 thingnario】歡迎你從medium了解更多 https://medium.com/@thingnarioA. 連薪資都公開透明的 thingnario 文化,真的可行嗎?B. 軟體新創一定需要募資嗎?C. 大型IoT系統開發 — 我們踩過的坑之Fluentd你為何delay

公司地址:

台灣 臺北市

其他:

【加分條件】- Github 開源專案參與經驗- 主導過 SLI / SLO / SLA 等系統穩定指標之制定與優化- 主導過全球範圍的雲端服務設計建置與日常維運- 具備組織團隊、人力規劃以及策略推動能力-2025-03-04
應徵