DevOps Engineer 面試問題 — 30多道問題與專家回答框架
勞動統計局預測軟體開發人員職位(越來越多地包含DevOps)到2034年將成長15%,而傳統系統管理員職位將下降4%,因為組織正在將基礎架構管理轉向程式碼驅動的自動化方法 [1] [2]。
關鍵要點
- DevOps面試測試軟體開發技能和基礎架構維運知識的獨特組合——純開發人員和純系統管理員都會面臨落差。
- 預期會遇到關於事件回應、流水線設計和Infrastructure as Code的情境式問題。
- 容器編排(Kubernetes)、CI/CD流水線設計和可觀測性策略是最常測試的三個技術領域。
- 行為問題重點關注無責任歸咎的事後回顧、跨團隊協作和值班事件處理。
- 展示安全優先(DevSecOps)思維是區分優秀求職者的關鍵。
行為問題
DevOps行為面試考察事件回應中的沉著、跨職能協作以及平衡可靠性與開發速度的能力 [3]。STAR方法是必備的。
1. 請講述你管理的一次正式環境事件。從告警到解決逐步說明。
這是DevOps的核心行為問題。描述觸發的告警、初始分類步驟、事件期間的溝通方式、確定的根本原因、部署的修復和防止再發的事後回顧行動項。量化:「實施自動回滾後,MTTR從3小時縮短至22分鐘。」
2. 描述一次你所做的基礎架構變更導致意外故障的經歷。
面試官想看到的是責任感和學習,而非完美。描述變更內容、測試為何未檢測到問題、如何檢測和緩解影響以及之後實施了哪些防護措施。
3. 講述開發團隊和維運團隊優先順序衝突的情況。
DevOps存在於快速交付和可靠運行的交會點。描述具體衝突、促進對話的方式、達成的妥協和可衡量的結果。
4. 描述一次自動化手動流程帶來顯著時間節省的經歷。
自動化是DevOps的核心價值主張。詳述手動流程、選擇的工具及理由、實施挑戰和時間節省。
5. 講述值班期間在資訊有限的情況下做出困難決策的經歷。
不確定性下的值班決策是DevOps的核心能力。描述情況、已有和缺失的資訊、決策及結果。
6. 描述你如何改善了一個系統的可觀測性。
描述實施的指標、日誌和追蹤,使用的工具(Prometheus、Grafana、ELK stack、Datadog),告警設計,以及改善的可觀測性如何改變了團隊診斷問題的能力。
技術問題
DevOps技術面試評估基礎架構、自動化、容器化和可靠性工程方面的深度。軟體開發人員的中位數薪資為133,080美元 [1]。
1. 為微服務應用程式設計CI/CD流水線。
描述每個階段:觸發器、靜態分析、單元測試、映像檔建置、整合測試、安全掃描、製品晉升、冒煙測試、金絲雀部署、自動回滾標準。討論分支策略 [3]。
2. 解釋Kubernetes如何處理Pod排程、擴縮和自癒。
描述排程器、HPA、自癒機制(liveness/readiness探針、ReplicaSet控制器)、requests vs. limits。
3. 如何為雲端環境實施Infrastructure as Code?
比較Terraform和CloudFormation(或Pulumi、CDK)。討論狀態管理、偏移檢測、模組複用、團隊工作流程 [4]。
4. 描述你的監控和告警策略方法。
討論USE方法和RED方法、告警路由、基於SLO的告警、維運手冊整合。提及Prometheus + Alertmanager、PagerDuty、Grafana。
5. 服務出現間歇性延遲峰值。如何診斷?
描述追蹤檢測(OpenTelemetry)部署、span關聯、資源爭用檢查。討論P50、P95、P99延遲差異。
6. 如何在CI/CD流水線和正式環境中管理密鑰?
討論HashiCorp Vault、動態密鑰、執行時注入、RBAC、稽核日誌。
7. 解釋藍綠部署、金絲雀部署和滾動更新。何時選擇每種?
討論每種策略的優缺點和適用場景。
情境問題
1. Kubernetes叢集在尖峰時段CPU使用率85%,大規模產品發佈兩週後。怎麼做?
討論即時行動、中期解決方案、應急計畫和成本權衡。
2. 開發者意外將AWS憑證推送到公開GitHub儲存庫。
立即輪換憑證、檢查CloudTrail日誌、實施pre-commit鉤子、通知資安團隊並進行事後回顧。
3. CI/CD流水線需要45分鐘。如何改善?
分析流水線、識別瓶頸、分離快速回饋和完整驗證。
4. 你的團隊不擁有的微服務導致串聯故障。
斷路器模式、逾時策略、隔艙模式、服務網格。
5. 管理階層希望從地端遷移到AWS。
盤點資產、分類工作負載、混合營運、著陸區安全、成功標準。
向面試官提問
- 「值班輪換如何安排?每週平均告警數?」 — 生活品質因素。
- 「部署頻率和變更失敗率?」 — DORA指標 [5]。
- 「事後回顧是否無責任歸咎?」 — 營運文化基礎。
- 「基礎架構程式碼化的比例?」 — 基礎架構成熟度。
- 「最大的可靠性挑戰?」 — 實際問題預覽。
- 「如何平衡新功能與可靠性/技術債?」 — 組織優先順序。
- 「Staff/Principal DevOps Engineer的職涯路徑?」 — 成長機會。
面試形式和預期
DevOps面試通常跨越3-5輪。招募篩選(20-30分鐘)、技術篩選(45-60分鐘)、現場輪次(系統設計、技術深入、程式撰寫、行為輪次)[3]。全流程2-4週。
如何準備
基礎架構知識(網路、Linux、雲端、容器化)、程式撰寫(Bash、Python)、系統設計(CI/CD、監控架構)[4]。學習DORA指標 [5],閱讀工程部落格(Netflix、Google SRE手冊、Etsy)。建構STAR故事。
常見面試錯誤
- 關注工具而非原則 — 解釋選擇工具的原因。
- 將手動救火描述為優勢 — 強調預防。
- 在流水線設計中忽視安全 — DevSecOps是期望標準。
- 不量化自動化影響 — 提供具體數字。
- 將IaC視為可選 — 一切都應程式碼化。
- 對可觀測性沒有觀點 — 解釋告警理念和SLO策略。
- 忽視事件回應的人性面 — 溝通同樣重要。
關鍵要點
DevOps面試評估一種稀有組合:軟體開發技能、基礎架構專業知識、營運判斷力和協作溝通。透過建構真實基礎架構、練習事件回應情境、開發STAR故事來準備。軟體開發人員職位到2034年成長15% [1],DevOps專家獲得薪資溢價,對這一多面面試流程的充分準備是決定職涯走向的投資。
使用Resume Geni建構ATS最佳化的DevOps Engineer履歷——免費開始。
常見問題
哪些認證有幫助? AWS Solutions Architect、CKA、HashiCorp Terraform Associate。不能替代實務經驗。
有程式撰寫問題嗎? 有,專注於實用自動化(Bash、Python)[3]。
雲端特定知識有多重要? 非常重要但可轉移。深入了解一個平台是期望的基線。
需要像軟體工程師一樣準備系統設計嗎? DevOps系統設計關注基礎架構架構而非應用程式架構。
需要了解哪些DORA指標? 部署頻率、變更前置時間、變更失敗率、MTTR [5]。
純開發/維運背景如何展示DevOps經驗? 強調跨職能工作和使用CI/CD、容器、雲端服務的個人專案。
SRE和DevOps一樣嗎? SRE是Google對DevOps原則的實施,更強調錯誤預算、SLO和將維運視為軟體問題。
引用
[1] U.S. Bureau of Labor Statistics, "Software Developers, Quality Assurance Analysts, and Testers," Occupational Outlook Handbook, 2024. [2] U.S. Bureau of Labor Statistics, "Network and Computer Systems Administrators," Occupational Outlook Handbook, 2024. [3] Tech Interview Handbook, "Software Engineering Interview Guide," 2025. [4] HashiCorp, "Infrastructure as Code in Practice," 2025. [5] DORA Team, "Accelerate State of DevOps Report," Google Cloud, 2024.