Site Reliability Engineer (SRE)
薪資範圍:50,000 ~ 100,000 TWD / month
工作內容
我們的遊戲平台處於高速成長階段,服務全球玩家,並且對 高可用性、高併發處理、低延遲 以及 雲端架構最佳化 有極高要求。我們正在尋找一位 Site Reliability Engineer (SRE),協助提升遊戲平台的可靠性與運營效率。
- 設計、開發及維護自動化運維工具,提高部署效率與系統穩定性,減少 Toil(重複性工作)。
- 監控並提升系統的 可用性 (Availability)、可擴展性 (Scalability)、效能 (Performance),確保系統穩定運行。
- 設計並實施 SLI/SLO/SLA,確保服務可靠性符合商業需求。
- 優化 CI/CD 流程,確保新功能部署順暢,並能迅速回滾異常版本。
- 與開發團隊合作,針對 高流量、高併發的遊戲平台架構 進行最佳化,提高應用程式效能與可靠性。
- 設計並執行 混沌工程 (Chaos Engineering) 測試,驗證系統在異常狀況下的韌性。
- 規劃與執行 Incident Response,包括 On-Call 輪值機制,快速應對異常狀況並進行 根本原因分析 (RCA)。
- 進行 雲端資源優化 (AWS/GCP/Azure),提升系統效能並降低運營成本。
- 制定與執行 系統安全性策略 (Security Best Practices),確保資料與基礎架構的安全。
職位要求
基本條件:
- 3 年以上 SRE、DevOps 或後端基礎架構相關經驗。
- 熟悉 Linux 系統管理 與 Shell Script。
- 精通至少一種程式語言(Python、Go、Java 等),用於自動化與工具開發。
- 熟悉 Kubernetes、Docker 等容器技術,具備 雲端平台 (AWS / GCP / Azure) 經驗。
- 熟悉 監控與告警工具(如 Prometheus、Grafana、Datadog、New Relic 等),能夠快速診斷系統異常。
- 具備 CI/CD 實作經驗(如 GitLab CI/CD、Jenkins、ArgoCD)。
- 具備 網路基礎知識(TCP/IP、DNS、負載平衡、CDN),能針對全球玩家提供最優化的網路連線體驗。
加分條件:
- 有大規模分散式系統(Distributed System)設計與維運經驗。
- 熟悉 Infrastructure as Code(Terraform、Ansible、Pulumi),可大規模自動化基礎架構管理。
- 具備高可用性 (HA) 與高併發 (High Concurrency) 架構經驗。
- 具備 Incident Management / On-call 經驗,能夠快速處理故障與恢復服務。
- 熟悉 遊戲服務後端架構 (Game Backend Architecture),理解遊戲業對延遲、同步機制的需求。
- 熟悉 混沌工程 (Chaos Engineering),可模擬故障測試並驗證系統韌性。
- 具備 資安經驗 (Security Best Practices),能確保遊戲平台的安全性。
珷琚科技是一家剛成立不久的游戲開發公司,我們充滿創新與激情,致力於將最新科技與獨特設計融合,創造出獨特的娛樂體驗。雖然我們是一家新興公司,但我們的團隊由業界頂尖專才組成,擁有豐富的經驗和無限的創造力。
經營理念追求最高品質的遊戲體驗,並秉持不斷創新的研發文化。作為一家新成立的公司,我們提供優越且舒適的工作環境,鼓勵員工之間的互動與溝通。我們相信,愉悅的工作氛圍能夠激發每一位成員的潛力,讓創意得以綻放。
創新驅動,追求卓越
我們相信,創新的力量來自於多元的思考和實踐。作為一家新成立的公司,我們以積極的態度探索各種創意和技術,致力於將每一個想法轉化為引人注目的產品,持續追求卓越的遊戲體驗。
勇於挑戰,迎接機遇
即使剛剛起步,我們也保持著對每一個挑戰的樂觀與好奇。對新興概念充滿開放的心態,勇敢面對困難,全力以赴尋找解決方案,將挑戰視為成長和機遇的良好契機。
合作共創,激發潛能
我們重視團隊合作,尊重並珍惜每一次溝通。並鼓勵成員之間的分享與互動,通過集思廣益、共同努力,實現更高的目標,並追逐更大的夢想。
加入我們!
如果您對創新充滿熱情,對挑戰充滿勇氣,並渴望在合作的氛圍中實現自我,誠摯邀請您加入我們!!
公司地址:
台中市西屯區市政北二路238號27樓之一其他:
None-2025-04-01