Portál AbcLinuxu, 10. května 2025 12:14
Jednička českého internetu s ohledem na svůj kontinuální růst sází na vlastní technologie. Pro zajištění optimálního chodu služeb, například Seznam.cz Vyhledávání, Mapy.cz, Seznam Email, Televize Seznam, Proženy.cz, Stream.cz a řady dalších, se její technici pustili do budování vlastní platformy. Pojmenovali ji SCIF – Seznam Compute Infrastructure. Každá ze služeb, které využívají miliony uživatelů měsíčně, má totiž odlišné požadavky na přenosy dat, výkon a jiné parametry. Na druhou stranu nepotřebují spoustu vychytávek, které nabízí na trhu běžně dostupný hardware.
SCIF je univerzální privátní cloudová platforma, postavená na bázi Platform as a Service, do které vývojáři Seznamu převádějí služby, u kterých by nebylo efektivní, aby běžely odděleně. Zpočátku Seznam zvažoval i řešení privátního cloudu od třetích stran, ale vyhrálo vlastní řešení. Cesta k němu trvá sice déle, ale výsledek je efektivnější a úspornější.
Technicky se SCIF skládá z nezávislých, navzájem integrovaných služeb, které kombinují různé open source technologie. Pro správu zdrojů používá Kubernetes a pro klasičtější virtuální servery OpenStack nad KVM.
Jednotlivé služby jsou propojené pomocí konceptu L3 softwarově definované sítě. Rozsahem a složitostí jde v rámci České republiky o unikátní nasazení projektu Calico. Zajímavostí je softwarový load balancing, který si vývojáři v Seznamu také dělají in-house. Využívají přitom mix technologií, například ECMP, asymetrické tunelování paketů a synchronizaci konfigurace pomocí ETCD.
Pro ukládání dat poskytuje SCIF objektovou storage založenou na projektu OpenStack Swift, ve kterém jsou data synchronizovaná přes více datových center.
Pro distribuovaný souborový systém plánují vývojáři využití Cephu, případně GlusterFS.
Vývoj SCIFu začal zhruba před rokem a půl a cílem je platforma běžící na 10 000 serverech ve třech datových centrech spravující desítky petabajtů dat. V současné době Seznam ještě není v cíli, většina infrastruktury už sice funguje, na SCIF však běží zatím stovky serverů. To je zhruba desetina z několika tisíc serverů, které v současnosti Seznam využívá.
Servery samotné staví hardwarový tým Seznamu na open hardwaru. K tomu si například navrhuje vlastní specializované desky pro úsporná úložiště postavená na čtyřjádrových procesorech ARM (Marvell, A72) s 4 GB operační paměti s ECC a gigabitovým ethernetem. V Seznamu jsou už k vidění i vzorky nových 4TB SSD s QLC čipy od Micronu, které jsou relativně levné a nabízejí vysokou kapacitu.
Pokud se budete chtít na Seznam Compute Infrastructure nebo jiných technologických projektech firmy podílet, můžete se podívat na aktuální nabídku pozic na kariérních stránkách nebo kontaktovat Lucii Kovaříkovou, manažerku náboru společnosti Seznam.cz, na e-mailu Lucie.Kovarikova@firma.seznam.cz nebo na telefonním čísle +420 724 863 558.
ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.