Khám phá việc làm Cloud & Infrastructure nổi bật.
Xem ngay

Middle DevOps Engineer ( Production Operations/ SRE )

Công ty Cổ phần Công nghệ DP Unity
331 Nguyễn Trọng Tuyển, P.10, TP Hồ Chí Minh
Tại văn phòng
Đăng 6 ngày trước
Chuyên môn:
Lĩnh vực:
Dịch Vụ và Tư Vấn IT

Mô tả công việc

Chúng tôi đang tìm kiếm DevOps Engineer có kinh nghiệm thực chiến (với tư duy DevSecOps trong vận hành) để xây dựng, vận hành và chuẩn hóa môi trường triển khai cho các hệ thống phần mềm phục vụ khối doanh nghiệp và cơ quan nhà nước. Vị trí này tập trung vào tự động hóa triển khai, giám sát hệ thống, bảo mật vận hành, sao lưu khôi phục và kiểm soát thay đổi.

Phần hỗ trợ IT nội bộ chiếm khoảng 10–20% thời gian, chủ yếu nhằm đảm bảo môi trường làm việc và hạ tầng nội bộ ổn định. Trọng tâm chính của vị trí vẫn là DevOps / production operations cho sản phẩm phần mềm.

Trách nhiệm chính:

  • Triển khai và vận hành ứng dụng trên các môi trường dev, staging, production.
  • Quản lý và theo dõi server, container, dịch vụ nền, reverse proxy và các thành phần liên quan trong hệ thống.
  • Thiết lập và duy trì hệ thống monitoring, logging, alerting để theo dõi tình trạng hạ tầng và ứng dụng.
  • Hỗ trợ quá trình release phần mềm, bảo đảm deploy an toàn, có kiểm soát, có khả năng rollback khi cần.
  • Xây dựng và duy trì pipeline CI/CD tự động hóa build, test và triển khai.
  • Phân tích, xử lý và phối hợp khắc phục các sự cố phát sinh trên môi trường vận hành.
  • Quản lý cấu hình môi trường, domain, SSL/TLS, certificate, secret và quyền truy cập hệ thống.
  • Xây dựng, thực hiện và kiểm tra quy trình backup/restore cho ứng dụng và cơ sở dữ liệu.
  • Viết và duy trì tài liệu vận hành, runbook, SOP, checklist release, checklist sự cố.
  • Phối hợp với team phát triển để chuẩn hóa cách đóng gói, triển khai và theo dõi ứng dụng sau release.
  • Hỗ trợ chuẩn bị các nội dung kỹ thuật liên quan đến vận hành, log, sao lưu, truy vết thay đổi và an toàn hệ thống khi cần.

Hỗ trợ IT nội bộ (kiêm nhiệm)

  • Hỗ trợ xử lý sự cố máy tính, thiết bị và phần mềm cho nhân viên nội bộ.
  • Quản lý và bảo trì hệ thống mạng nội bộ (LAN/WiFi, switch, router, VPN) và đường truyền.
  • Quản lý server nội bộ, tài khoản người dùng, phân quyền và thiết bị dùng chung (máy in, NAS…).

Yêu cầu công việc

Kinh nghiệm:

  • Có từ 2–3 năm kinh nghiệm ở vị trí DevOps, System Engineer, Infrastructure Engineer hoặc tương đương (hoặc ít hơn nếu kinh nghiệm vận hành production thực tế tương đương).
  • Có kinh nghiệm thực tế trong deploy và vận hành production cho hệ thống web, API hoặc dịch vụ backend.

Kỹ năng bắt buộc:

  • Thành thạo Linux server administration.
  • Có kinh nghiệm tốt với Docker, Docker Compose hoặc công cụ tương đương.
  • Có kinh nghiệm cấu hình và vận hành Nginx hoặc reverse proxy tương đương.
  • Theo dõi và xử lý được các sự cố vận hành: tài nguyên (CPU / RAM / disk / network), crash process/service, lỗi ứng dụng sau deploy, lỗi kết nối giữa các service.
  • Có khả năng viết shell script hoặc script tự động hóa cơ bản phục vụ triển khai và vận hành.

Cần biết để làm tốt

  • Có kinh nghiệm xây dựng pipeline CI/CD để tự động hóa build, test và deploy (GitHub Actions, GitLab CI, Jenkins hoặc tương đương).
  • Biết tích hợp chạy test tự động vào pipeline làm cổng kiểm soát chất lượng (quality gate) trước khi release; thiết lập health check / smoke test sau deploy và kiểm tra khôi phục (restore test) cho backup.
  • Có kinh nghiệm với các công cụ monitoring / logging / alerting: Prometheus, Grafana, ELK / OpenSearch / Loki, Zabbix hoặc tương đương.
  • Có kinh nghiệm quản lý SSL/TLS, domain, certificate.
  • Có kinh nghiệm backup/restore cho ít nhất một loại database phổ biến (PostgreSQL, MySQL, SQL Server hoặc MongoDB).
  • Có hiểu biết cơ bản về vận hành an toàn: quản lý secret, phân quyền truy cập, kiểm soát thay đổi, audit log, hardening cơ bản cho server.

Tài liệu và phối hợp:

  • Viết được tài liệu kỹ thuật rõ ràng, dễ dùng.
  • Có khả năng phối hợp tốt với team dev, QA, PM trong quá trình release và xử lý sự cố.
  • Có tinh thần trách nhiệm, cẩn thận, bình tĩnh khi xử lý hệ thống production.

Ưu tiên:

Các mục dưới đây là lợi thế cộng thêm, không bắt buộc — có một vài trong số này đã là điểm mạnh.

  • Kinh nghiệm vận hành hạ tầng AI: triển khai và phục vụ (serving) mô hình AI/LLM; quản lý server GPU; tối ưu tài nguyên và chi phí cho workload AI.
  • Quen với các công cụ phục vụ mô hình như Ollama, vLLM, Triton, TorchServe hoặc tương đương; biết đóng gói và vận hành dịch vụ inference qua API.
  • Có kinh nghiệm với hạ tầng / cloud trong nước (VNPT, Viettel, FPT, VNG Cloud…) — phù hợp đặc thù khách hàng doanh nghiệp và cơ quan nhà nước.
  • Có kinh nghiệm triển khai và vận hành kiến trúc microservice (service discovery, API gateway, giao tiếp giữa các service).
  • Có kinh nghiệm với Kubernetes (k8s): triển khai, scaling, vận hành và xử lý sự cố cluster — hoặc các nền tảng điều phối container tương đương.
  • Có kinh nghiệm làm việc với môi trường on-premise, private cloud hoặc datacenter.
  • Đã từng làm trong môi trường yêu cầu cao về tính ổn định hệ thống, kiểm soát thay đổi, backup/restore, audit, logging, truy vết.
  • Có hiểu biết cơ bản về các yêu cầu an toàn thông tin, dữ liệu cá nhân hoặc vận hành hệ thống cho khách hàng doanh nghiệp / cơ quan nhà nước.
  • Có kinh nghiệm IT helpdesk / quản trị mạng nội bộ (xử lý sự cố máy tính, LAN/WiFi, quản lý tài khoản và thiết bị văn phòng).

Tại sao bạn sẽ yêu thích làm việc tại đây

  • Lương: thỏa thuận theo năng lực và kinh nghiệm thực tế, cạnh tranh so với mặt bằng thị trường.
  • Tham gia BHXH, BHYT, BHTN theo quy định của Nhà nước và Công ty.
  • Lương tháng 13, thưởng các ngày lễ, Tết và thưởng theo hiệu suất làm việc.
  • Làm sản phẩm thật: vận hành hệ thống thực tế phục vụ khách hàng doanh nghiệp và cơ quan nhà nước, không phải môi trường thử nghiệm.
  • Hạ tầng AI cho AEC/BIM: cơ hội tham gia xây dựng hạ tầng vận hành cho sản phẩm AI trong lĩnh vực AEC/BIM — backend service, hệ thống triển khai, monitoring/logging, và trong tương lai có thể mở rộng sang hạ tầng phục vụ AI/LLM inference (GPU serving).
  • Lộ trình phát triển: cơ hội phát triển lên Senior / Lead, hoặc theo hướng Site Reliability / Platform Engineer khi hệ thống mở rộng.
  • Hỗ trợ thiết bị làm việc và ngân sách học tập / chứng chỉ chuyên môn (theo chính sách công ty).
  • Môi trường làm việc trẻ trung, đề cao tính chủ động, định hướng phát triển lâu dài.

Công ty Cổ phần Công nghệ DP Unity

Mô hình công ty
Sản phẩm
Lĩnh vực công ty
Dịch Vụ và Tư Vấn IT
Quy mô công ty
1-50 nhân viên
Quốc gia
Vietnam
Thời gian làm việc
Thứ 2 - Thứ 6
Làm việc ngoài giờ
Không có OT

Việc làm tương tự dành cho bạn

Nhận các việc làm tương tự qua email Nhận thông báo