1. 지금 담당하고 계신 클라우드 엔지니어 직무와 멘토님의 구체적인 업무에 대해 개발 업무(앱, 웹, 서버 등)와 비교하여 설명을 부탁드립니다. |
현재 저는 KT Cloud의 Cloud SW 운영팀에서 클라우드 엔지니어로 근무하고 있습니다. 제가 맡은 업무는 공공 및 민간 클라우드 서비스를 제공하는 OpenStack 이라는 플랫폼을 운영하고 있습니다. 서버를 관리하는 서버 엔지니어와 유사하지만, 좀 더 가상화 기술에 더 특화되어 클라우드 서비스 플랫폼을 운영합니다. 클라우드 엔지니어는 기본적으로 웹/앱 개발 업무보다는 클라우드 환경을 안정적으로 운영하고 관리하는 업무를 수행합니다. |
2. 클라우드 엔지니어로서 갖추어야 할 핵심 역량은 무엇인가요? |
클라우드 엔지니어는 IT 직군 중에서 가장 넓은 범위를 다룬다고 생각합니다. 클라우드 서비스는 네트워크, 데이터베이스, 하드웨어, 보안, 운영체제 등 다양한 리소스를 다루기 때문에, 모든 분야에 대한 기본적인 이해가 필요합니다. 물론, 네트워크 엔지니어와 같은 특정 분야의 전문가만큼 깊이 알 필요는 없지만, 여러 부서(하드웨어 엔지니어, 네트워크 엔지니어, 보안팀 등)와 협업할 일이 많아 폭넓은 지식이 요구됩니다. 따라서 클라우드 엔지니어를 준비한다면, 무엇보다도 컴퓨터공학에서 배우는 기초적인 CS 지식을 잘 갖추는 것이 가장 중요하다고 생각합니다. |
4. 클라우드 엔지니어가 되기 위해 필요한 자격증이나 지식은 무엇인가요? |
자격증이 있으면 도움이 되지만 필수는 아닙니다. 저는 정보처리기사와 SQLD 정도만 취득했었습니다. 추가로 자격증을 고려하신다면 AWS, GCP, Azure와 같은 퍼블릭 클라우드 자격증 하나 정도 취득하는 것이 좋을 것 같습니다. 하지만 클라우드를 활용한 프로젝트 경험이 가장 큰 도움이 되고, 컴퓨터 공학(CS) 지식도 매우 중요합니다. |
5. 클라우드 엔지니어로서 느끼는 아쉬움이나 단점이 있다면 무엇인가요? |
클라우드는 기본적으로 고가용성(HA)을 제공하지만, 항상 100%의 안정성을 보장하지는 않습니다. 따라서 큰 문제가 발생했을 때는 저희가 직접 해결해야 할 경우가 있습니다. 저희 회사는 AWS와 같은 퍼블릭 클라우드가 아닌 자체 클라우드 서비스를 제공하기 때문에, 글로벌 클라우드 기업들에 비해 장애 발생 빈도가 조금 높은 편입니다. 그래서 특히 주말이나 새벽에 장애가 발생하면, 문제 해결을 위해 긴급 전화를 받고 즉시 대응해야 하는 상황이 종종 발생해 업무 외 시간에 편하게 쉬기 어렵다는 단점이 있습니다. |
6. 멘토님의 회사나 속하신 팀에서 업무 생산성을 높인 핵심 요인은 무엇인가요? 기술적인 부분뿐만 아니라 협업 방식이나 인간관계 측면에서도 궁금합니다. |
제가 속한 팀은 저를 포함해 3명이 클라우드 소프트웨어 운영을 담당하고 있으며, 관리하는 물리 서버만 약 600대에 달합니다. 당연히 이 모든 서버를 3명이서 관리하는 것은 불가능하므로, 클라우드 회사에서는 효율적인 운영을 위해 클라우드 리소스 모니터링 도구를 도입해 관리합니다. 이러한 모니터링 도구를 잘 이해하고 활용하는 것이 클라우드 서비스 운영에서 업무 생산성을 크게 높일 수 있는 방법 중 하나입니다. 또한, 저희 회사는 많은 협력사를 두고 있어, 간단한 업무 및 단순 반복 업무는 협력사에 위임하는 방식으로 클라우드 서비스를 운영하고 있습니다. |
7. 직장 생활에서 겪었던 가장 힘들었던 순간은 무엇이었나요? 기술적 어려움이든, 인간관계든, 다양한 경험 속에서 느끼셨던 점을 자유롭게 이야기해주시면 좋겠습니다. 그때 어떻게 극복하셨는지도 궁금합니다. |
직장 생활을 시작하면, 본인이 기대했던 업무와 다른 업무를 하는 경우가 굉장히 많을 것입니다. 저 역시 제가 기대했던 혹은 예상했던 업무와 현재 업무가 많이 다릅니다. 저도 처음에는 이 상황에서 많은 고민을 했었고, 지금도 여전히 고민하고 있습니다. 이 상황에서 두 가지 선택을 할 수 있을텐데, 하나는 본인이 기대했던 업무/회사를 다시 찾아보는 것이고, 다른 하나는 시간을 두고 현재 회사의 업무에 천천히 적응해보는 것입니다. 어느 쪽이든 정답은 없으며, 중요한 것은 충분히 고민하고 자신에게 맞는 선택을 하는 것이라고 생각합니다. |
그리고 IT 직군을 선택한 이상, 기술 발전을 위해 지속적으로 공부하는 것은 필수적이라고 생각합니다. 이 점을 항상 염두에 두고 IT 분야에 발을 들이셨으면 좋겠습니다. |
|
8. 학생 때 진행하셨던 프로젝트와 그 과정에서 겪은 문제, 유지 보수를 통해 배운 점에 대해 이야기해주실 수 있을까요? |
학부 시절에 퍼블릭 클라우드 서비스를 활용해 쿠버네티스 환경을 구축하고 웹 서비스를 운영한 프로젝트 경험이 있습니다. 실제로 서비스 자체는 매우 간단했지만, 클라우드 환경과 쿠버네티스의 컨테이너를 다루면서 클라우드 환경에 대해서 깊이있게 학습할 수 있었습니다. 이 과정에서 고가용성, 오토스케일링, 배포 자동화 등을 적용해서 유연하고 확장성있는 인프라를 구축해볼 수 있었습니다. |
9. CS(컴퓨터 과학) 지식이 실제 현업에서 어떻게 적용되는지 구체적인 사례가 있다면 궁금합니다. |
클라우드 서비스는 구성 요소가 매우 복잡하게 이루어져 있어 다양한 유형의 장애가 발생할 수 있고, 그 원인 또한 다양합니다. 실제 서버나 네트워크 장비와 같은 하드웨어 문제일 수도 있고, 운영체제나 소프트웨어, 혹은 보안과 관련된 문제일 수도 있습니다. 장애가 발생하면 현상을 파악하고 원인을 분석하는 과정에서 컴퓨터 공학(CS) 지식이 많을수록 빠르게 원인을 분석하고 해결할 수 있으므로, CS 지식은 실제 현업에서 너무나도 중요합니다. |
10. 학생으로서 대규모 트래픽을 직접 다루는 기회가 많지 않아, 시스템 과부하와 같은 문제를 쉽게 인지하기 어려웠습니다. 현업에서는 이런 문제를 어떻게 발견하고 개선하는지 알고 싶습니다. |
학부 수준에서 대규모 트래픽을 실제로 다루는 것은 현실적으로 어려운 일이라고 생각합니다. 취업을 준비할 때, 회사도 이 점을 충분히 이해할 것이며, 중요한 것은 대규모 트래픽 상황에 대해 어디까지 고민해보고 어떤 해결 방안을 생각해보았는지라고 생각합니다. |
클라우드 회사는 웹이나 앱과 같은 서비스를 제공하는 것이 아니기 때문에, 그로 인해 발생하는 대규모 트래픽을 직접 처리하지는 않습니다. 저희는 고객이 사용하는 인프라에 QoS(Quality of Service)와 같은 대역폭 설정을 통해 고객이 사용할 수 있는 트래픽을 제한하여 인프라를 제공합니다. 그러나 저희 클라우드 내부 인프라에서도 보안 문제나 네트워크 장비 고장 등으로 인해 트래픽 부하가 발생하는 경우가 있습니다. 이러한 상황은 사전에 예측하기 어렵기 때문에, 저희 클라우드 환경에서는 항상 24시간 관제를 통해 문제 발생 시 신속하게 대응하고 있습니다. |
|
11. KT cloud는 무슨 회사이고 클라우드 사업은 어떤 사업인가요? |
저희 회사는 크게 데이터센터와 클라우드 서비스를 제공하는 회사입니다. 저희 회사의 클라우드 서비스는 주로 공공기관을 대상으로 하지만, 민간 고객을 위한 서비스도 제공하고 있습니다. |
공공 클라우드를 예로 들면, 정부 기관이나 지방자치단체 등 공공 부문에 클라우드 서비스를 통해 효율성, 안정성, 보안성을 향상시키는 IT 인프라를 제공해주고 있습니다. |
|
12. 업무일과와 회사의 장점/단점이 궁금합니다. |
저희 회사는 공공사업과 민간사업을 모두 고려하는 비즈니스 모델을 가지고 있어, 타 부서와의 교류할 일이 굉장히 많습니다. 따라서 IT 직군이라 하더라도 하루에 몇 시간씩 회의에 참석하는 일이 많습니다. 운영 중 발생하는 장애 처리 및 VoC(Voice of the Customer) 대응 업무와 사내 의사 결정을 위한 회의 참여가 주된 업무라고 볼 수 있습니다. |
저희 회사는 분사한 지 얼마 되지 않아 대기업 문화와 스타트업 문화가 혼합된 것이 장점이자 단점이라고 생각합니다. 신생 기업인 만큼 아직 체계가 완전히 잡히지 않아 조직 및 업무적인 변화가 잦고, 그만큼 업무량이 많으며 배워야 할 것도 많습니다. 하지만 이러한 끊임없는 변화 속에서 많은 것을 배울 수 있고, 대기업이지만 스타트업 같은 유연한 분위기를 느낄 수 있습니다. |
|