Vzhľadom k tomu, sieť je tak obrovský, monitorovanie a starostlivosť o ne je náročná úloha. Pri vývoji GFS, programátori sa rozhodol, ako veľa z administratívnych úloh nutných na udržanie systém beží ako je to možné automatizovať. To je kľúčovým princípom autonómna výpočtovej techniky, čo je pojem, v ktorej počítače sú schopní diagnostikovať problémy a riešiť ich bez nutnosti ľudského zásahu v reálnom čase. Výzvou pre GFS tímu bolo nielen vytvoriť automatický monitorovací systém, ale tiež navrhnúť tak, aby to mohlo fungovať cez obrovskú sieť počítačov.
Kľúč návrhov v tíme bola predstava o zjednodušení , Došli k záveru, že aj systémy rastú zložitejšie, vznikajú problémy častejšie. Jednoduchý prístup je ľahšie ku kontrole, aj keď rozsah systému je obrovský.
Na tomto základe filozofie, tím GFS rozhodol, že užívatelia by mali prístup k základným príkazom súborov. Patrí medzi ne príkazy, ako je otvorený, vytvárať, čítať, písať a zatvárať súbory. Tím tiež niekoľko špecializovaných príkazov: Pripojiť a snímku. Oni vytvorili špecializované príkazy na základe potrieb spoločnosti Google. Pripojiť umožňuje klientom pridať informácie do existujúceho súboru bez prepísania predtým zapísané dáta. Snímka je príkaz, ktorý vytvorí rýchlu kópiu obsahu počítača.
Súbory na GFS bývajú veľmi veľké, zvyčajne v multi-gigabajt (GB) rozsah. Prístup a manipuláciu s súbory, ktoré by veľké zaberajú veľa šírku pásma siete. Šírka pásma je kapacita systému pre presun dát z jedného miesta na druhé. GFS rieši tento problém tým, že rozbije súbory až do kusov 64 megabajtov (MB) každý. Každý kus dostane unikátny 64-bitové identifikačné číslo s názvom kus rukoväť. Kým GFS môže spracovávať menšie súbory, jeho vývojári nemali optimalizovať systém pre tieto typy úloh.
Na základe požiadavky, všetkých súborových kúsky byť rovnakej veľkosti, GFS zjednodušuje použitie zdrojov. Je ľahké zistiť, ktoré počítače v systéme sú takmer na plnú kapacitu, a ktoré nie sú dostatočne využívané. Je tiež jednoduché na prístavné kúsky z jedného zdroja na druhý vyvážiť pracovné vyťaženie v rámci celého systému.
Čo je skutočný dizajn pre GFS? Čítajte ďalej, ako to zistiť.
Google File System Architecture
Google organizoval GFS do zhlukov počítačov. Klaster je jednoducho sieť počítačov. Každý cluster môže obsahovať stovky alebo dokonca tisíce stro