Каква е ролята на Site Reliability инженерите и какви познания и умения е добре да имат?

30 септември 2019
Каква е ролята на Site Reliability инженерите и какви познания и умения е добре да имат?
През 2003 година Google за първи път използва термина SRE (Site Reliability Engineering) и оттогава това направление в софтуерната разработка започва да се развива като самостоятелна професия.

През последните няколко години все повече компании търсят Site Reliability инженери и инвестират в такъв тип екипи.

Какви обаче са изискванията към SR инженерите и какъв опит и познания следва да притежават те?

Концепцията на SRE е все още нова и поради тази причина на пазара на труда почти няма готови специалисти или обучителни програми, посветени конкретно на това направление. В същото време обаче търсенето на SRE специалисти от страна на компаниите нараства, което налага промяна в квалификацията на част от хората в екипа и техните роли.

“Определено се забелязва ръст на наемането на Site Reliability инженери в глобален план. За България също има търсене на такъв тип експерти, дори в момента в DataArt имаме отворени позиции за SRE. Подходящи за това направление са DevOps инженери, Java програмисти, хора, които имат опит с SQL, Unix/Linux. Предимство в случая са познанията в облачните технологии, доброто разбиране относно практиките за разработване на системи с високо натоварване, измерване на надеждността и т.н.”, коментира Любомира Атанасова, HR мениджър в българския офис на компанията за разработка на софтуерни решения DataArt.

Какво всъщност работи Site Reliability инженерът?

Често SRE се отъждествява със системен администратор. Истината обаче е, че тези две професии са доста различни, макар и да имат допирни точки. Още по-погрешно е схващането, че Site Reliability инженерите се занимават с разработка или поддръжка на уеб сайтове поради първата дума в наименованието. Ако трябва да посочим направление, което да е най-близко до SRE, то това би било DevOps, макар и отново да не съществува знак за равенство.

SR инженерите се занимават с търсенето и отстраняването на грешки в приложението и се стремят непрекъснато да подобряват надеждността на системата. В същото време, Site Reliability екипът не е просто екип по поддръжка. Въпреки че отстраняването на неизправности също е отговорност на хората, занимаващи се със SRE, тяхната основна задача е да определят степента на ефективност на системата и да работят по подобряване на нейната надеждност.

SRE може да се превърне в съпорт екип, само ако процесът е неправилно организиран: когато броят на проблемите расте като лавина и инженерите просто нямат време да свършат основната си работа.

В такъв случай - какви умения и познания е добре да притежава SRE инженерът?

Комплексните познания и професионален опит в някои от следните направления със сигурност биха били предимство за хората, които са решили да се насочат към SRE:

  1. Опит като DevOps
  2. Програмни умения
  3. Опит в Linux системна администрация
  4. Опит в автоматизацията на инфраструктурата
  5. Наличие на т. нар. „Soft skills”

В много случаи към SRE се насочват DevOps инженери, които са решили да се впуснат в нови предизвикателства и да надградят своя опит. За тази роля обаче могат да се окажат подходящи и разработчици, владеещи Java или Python, например, които, освен познания за писане на код, притежават и аналитично мислене, внимание към детайлите и способност за разрешаване на проблеми.

За щастие, обхватът на задачите е много широк - от наблюдение и сигнализиране за проблеми (типични задачи на DevOps) до комплексно отстраняване на неизправности, което може да се направи от опитни разработчици.

Кога най-често е нужно наемането на SR инженери?

SR инженерите са необходими предимно при работа в големи проекти на компании със сложни, високонатоварени приложения. Те са тези, които знаят как се държи системата в реални условия, особено ако нещо се обърка – например - с мрежовата връзка или базата данни. Това знание е необходимо не само за бързо стабилизиране на приложението, но и за извършване на нужните промени в изходния код.

Прогнозите сочат, че търсенето на специалисти за SRE екипи ще се повиши през следващите три години, а наемането им може да се превърне във важен ресурс за всяка компания, насочена към големи бизнес проекти. Системите продължават да се усложняват, общите разходи се увеличават, което е предпоставка за по-сериозно търсене на такъв тип експерти.