รายละเอียดงานระยะเวลาของการฝึกงาน: 3-6 เดือน
- สนับสนุนทีม SRE ในการตรวจสอบและดูแลความเสถียรของระบบ Server และ Service ต่าง ๆ
- ติดตามและตอบสนองต่อ Incident หรือ Alarm เบื้องต้น
- เรียนรู้การใช้งาน Monitoring Tools เช่น Prometheus, Grafana, Zabbix เป็นต้น
- ทดสอบระบบ Automation เช่น Bash Script, Ansible, และ CI/CD Pipeline
- ช่วยทำเอกสาร Deployment, Post-Incident Report และ Network Diagram
- มีส่วนร่วมในการประชุมเชิงเทคนิค วิเคราะห์ปัญหา และเสนอแนวทางแก้ไขร่วมกับทีม
- เรียนรู้การทำงานในระบบจริงที่มี GPU Infrastructure และ AI Workloads
ค่าตอบแทนและสวัสดิการ
Fitness