Simuliatoriumi pagrįstas mokymasis duomenų centro aušinimo optimizavimui


  • Dalinamės daugiau apie sustiprinto mokymosi vaidmenį padedant mums optimizuoti duomenų centrų aplinkos kontrolę.
  • Mūsų mokymu paremtas metodas padėjo mums sumažinti energijos suvartojimą ir vandens naudojimą įvairiomis oro sąlygomis mūsų duomenų centruose.
  • „Meta“ atnaujina savo naują duomenų centro dizainą, siekdama optimizuoti dirbtinį intelektą, o ta pati metodika bus taikoma ir būsimiems duomenų centrų optimizavimui.

Efektyvumas yra vienas iš pagrindinių Meta požiūrio į projektuojant, statant ir eksploatuojant tvarius duomenų centrus. Be IT apkrovos, aušinimas yra pagrindinis energijos ir vandens vartotojas duomenų centro aplinkoje. Aušinimo efektyvumo gerinimas padeda sumažinti energijos suvartojimą, vandens naudojimą ir šiltnamio efektą sukeliančių dujų (ŠESD) išmetimą, taip pat padeda spręsti vieną iš didžiausių iššūkių – klimato kaitą.

Dauguma esamų „Meta“ duomenų centrų naudoja lauko oro ir garavimo aušinimo sistemas, kad aplinkos sąlygos būtų palaikomos temperatūros ribose. nuo 65°F iki 85°F (18°C ir 30°C) ir santykinė oro drėgmė nuo 13 iki 80%. Kadangi kondicionuojant šį orą sunaudojamas vanduo ir energija, tiekiamo oro srauto, kurį reikia kondicionuoti, kiekio optimizavimas yra didelis prioritetas siekiant pagerinti veiklos efektyvumą.

Nuo 2021 m panaudoti AI, siekiant optimizuoti oro srauto tiekimą į duomenų centrus vėsinimo tikslais. Naudodami treniruokliu pagrįstą sustiprinimo mokymąsi, vidutiniškai 20 % sumažinome tiekiamo ventiliatoriaus energijos sąnaudas viename iš bandomųjų regionų ir 4 % vandens suvartojimą įvairiomis oro sąlygomis.

Anksčiau mes dalinomės fizikos pagrindu terminis simuliatorius padeda optimizuoti duomenų centrų aplinkos kontrolę. Dabar plačiau paaiškinsime mokymosi sustiprinimo vaidmenį sprendime. Kadangi Meta atnaujina savo naują duomenų centro dizainą, siekdama optimizuoti dirbtinį intelektą, ta pati metodika bus taikoma ir būsimiems duomenų centrų optimizavimui bei veiklos efektyvumui gerinti.

Šiuo metu „Meta“ duomenų centrai naudoja dviejų pakopų mansardos dizainą, kuriame vėsinimui naudojamas 100 % lauko oro. Kaip parodyta 1 paveiksle, oras patenka į patalpą per antrojo aukšto mansarda esančias žaliuzes su moduliuojančiomis sklendėmis, reguliuojančiomis lauko oro tūrį. Oras praeina per maišymo patalpą, kur lauko oras, jei per šaltas, gali būti maišomas su serverio išmetamųjų dujų šiluma, kai reikia temperatūrai reguliuoti.

Tada oras praeina per daugybę oro filtrų ir rūko kamerą, kurioje garavimo aušinimo ir drėkinimo (ECH) sistema naudojama toliau kontroliuoti temperatūrą ir drėgmę. Oras tęsiasi per ventiliatoriaus sienelę, kuri stumia orą per grindų angas, kurios tarnauja kaip oro šachta, vedanti į serverio zoną pirmame aukšte. Karštas oras, išeinantis iš serverio išmetimo angos, bus patalpintas karštajame koridoriuje per išmetimo šachtas ir galiausiai išleidžiamas iš pastato naudojant reljefo ventiliatorius.

Vanduo daugiausia naudojamas dviem būdais: garuojantis aušinimas ir drėkinimas. Garavimo aušinimo sistema paverčia vandenį garais, kad sumažintų temperatūrą, kai lauko oras per karštas, o drėkinimo procesas palaiko drėgmės lygį, jei oras yra per sausas. Manome, kad šio dizaino rezultatas „Meta“ duomenų centrai yra vieni pažangiausių, energiją ir vandenį taupančių duomenų centrų pasaulyje.

1 pav. Mansarda aušinimo sistema Meta duomenų centruose.

Kad būtų tiekiamas oras nustatytoje veikimo zonoje, mansarda remiasi pastato valdymo sistema (BMS), kuri stebi ir valdo įvairius mechaninės sistemos komponentus. Ši sistema atlieka iš lauko įleidžiamo oro kondicionavimo užduotį maišant, drėkinant/sausinant, garuojant vėsinant arba derinant šias operacijas.

Yra trys pagrindinės valdymo kilpos, atsakingos už tiekiamo oro kontrolinių verčių reguliavimą: temperatūra, drėgmė ir oro srautas. Oro srauto kontrolinė vertė paprastai apskaičiuojama remiantis nedideliu įvesties kintamųjų rinkiniu, pvz., esama IT apkrova, šalto koridoriaus temperatūra ir slėgio skirtumu tarp šalto ir karšto koridoriaus. Linijiniu mastu logika dažnai yra labai paprasta, tačiau ją labai sunku tiksliai modeliuoti, nes šios vertės skirtingose ​​duomenų centro vietose yra susietos viena su kita ir labai priklauso nuo sudėtingų vietinių ribinių sąlygų. Tačiau nuo oro srauto kiekio priklausys tiekiamo ventiliatoriaus masyvų sunaudota energija ir vandens suvartojimas, kai reikia vėsinti ar drėkinti. Todėl oro srauto nustatytosios vertės optimizavimas turėtų didžiausią poveikį toliau gerinant aušinimo efektyvumą, atsižvelgiant į tai, kad veikimo apvalkalo temperatūros ir drėgmės riba yra fiksuota.

Sustiprinimo mokymasis (RL) puikiai tinka modeliuoti valdymo sistemas kaip nuoseklias būsenos mašinas. Jis veikia kaip programinės įrangos agentas, kuris nustato, kokių veiksmų reikia imtis kiekvienoje būsenoje, remiantis tam tikru perėjimo modeliu, kuris veda į skirtingą būseną, ir nuolat gauna grįžtamąjį ryšį iš aplinkos apie atlygį. Galiausiai agentas išmoksta geriausią politikos modelį (paprastai jį parametruoja gilus neuroninis tinklas), kad pasiektų optimalų sukauptą atlygį. Duomenų centro aušinimo valdymas gali būti natūraliai modeliuojamas pagal šią paradigmą.

Bet kuriuo metu duomenų centro būsena gali būti pavaizduota aplinkos kintamųjų rinkiniu, stebimu daugybe skirtingų lauko oro, tiekiamo oro, šalto ir karšto koridoriaus jutiklių bei IT apkrovos (ty serverių energijos suvartojimo), ir tt. Veiksmas yra skirtas kontrolinių verčių valdymui – pavyzdžiui, tiekiamo oro srauto kontrolinę vertę, kuri nustato, kaip greitai tiekimo ventiliatoriai veikia, kad patenkintų poreikį. Politika yra funkcijos susiejimas iš būsenos erdvės į veiksmų erdvę (ty, nustatant tinkamą oro srauto nuostatą pagal esamas būsenos sąlygas). Dabar užduotis yra panaudoti istorinius duomenis, kuriuos surinkome iš tūkstančių mūsų duomenų centruose esančių jutiklių, papildytais modeliuotais potencialių, bet dar nepatirtų sąlygų duomenimis, ir parengti geresnį politikos modelį, kuris duoda mums didesnį atlygį energijos ar vandens atžvilgiu. naudojimo efektyvumą.

Idėja naudoti AI duomenų centro aušinimo optimizavimui nėra naujas. Taip pat pranešama apie įvairius RL metodus, pavyzdžiui, aušinimo optimizavimo pakeitimas per gilų sustiprinimo mokymąsi ir duomenų centro aušinimas naudojant modelio nuspėjamąjį valdymą.

Tačiau taikant internetinio RL modelio nustatytą valdymo politiką, gali kilti įvairių pavojų, įskaitant paslaugų reikalavimų pažeidimus ir net šiluminę nesaugą. Norėdami išspręsti šį iššūkį, pasirinkome neprisijungus treniruokliu pagrįstą RL metodą. Kaip parodyta 2 paveiksle, mūsų RL agentas veikia imituotoje aplinkoje, pradedant nuo realių istorinių stebėjimų, S. Tada jis tyrinėja veiksmo erdvę, įtraukdamas į treniruoklį, kad nuspėtų numatomą naują būseną S’ ir atlygis, R, atsižvelgiant į kiekvieną atrinktą veiksmą, A. Iš ten jis surenka poras (S, A).

2 pav. Mūsų modeliuojamas RL metodas neprisijungus.

Mūsų simuliatorius yra a fizika pagrįstas pastato energijos vartojimo modelis įvesties laiko eilutės, pvz., orų duomenys, IT apkrova ir nustatytų verčių tvarkaraščiai. Modelis sukurtas atsižvelgiant į duomenų centro pastato parametrus, įskaitant geometriją, statybines medžiagas, ŠVOK, sistemos konfigūracijas, komponentų efektyvumą ir valdymo strategijas. Jis naudoja diferencialines lygtis, kad išvestų dinaminį sistemos atsaką, pvz., šiluminę apkrovą ir susijusį energijos suvartojimą, kartu su susijusia metrika, pvz., šalto koridoriaus temperatūra ir diferencinio slėgio profiliais.

Simuliatorius čia atlieka labai svarbų vaidmenį, nes mūsų tikslas yra optimizuoti energijos ir vandens naudojimą, išlaikant duomenų centro būklę pagal specifikacijas, kad nenukentėtų aparatinės įrangos veikimas. Tiksliau, norime, kad šalto koridoriaus temperatūros kilimas būtų mažesnis už tam tikrą ribą arba teigiamas slėgis iš šalto koridoriaus į karštą, kad sumažintume parazitinę šilumą, kurią sukelia recirkuliacija.

Be to, fizikos pagrindu sukurtas treniruoklis leidžia treniruoti RL modelį pagal visus galimus scenarijus, ne tik tuos, kurie yra istoriniuose duomenyse. Tai padidina patikimumą išskirtinių įvykių metu ir leidžia greitai įdiegti naujai pradėtuose naudoti duomenų centruose.

2021 m. pradėjome bandomąjį projektą viename iš „Meta“ duomenų centro regionų – turėdami RL modelį, tiesiogiai valdantį tiekiamo oro srauto kontrolinę vertę. 3 paveiksle parodytas naujos kontrolinės vertės, išreikštos kubinių pėdų per minutę (CFM) vienetais, kaip raudona linija, palyginimas su pradine BMS kontroline verte (taškine mėlyna linija) per vieną savaitę.

3 pav. RL modelio palyginimas su pradine BMS nustatyta verte.

Svyravimą daugiausia lemia tiekiamo oro temperatūra ir serverio apkrovos ciklai skirtingu paros metu. Dar svarbiau yra tai, kad, kaip parodyta 4 paveiksle, duomenų centro temperatūros sąlygos niekada nebuvo nustatytos, o oro srautas sumažėjo tiek šalto koridoriaus vidutinės, tiek maksimalios temperatūros atžvilgiu, palyginti su tiekiamo oro temperatūra.

4 pav. Duomenų centro temperatūros profilis valdant RL modelį.

Pastebima, kad CFM taupymas skiriasi esant skirtingoms tiekiamo oro temperatūroms, kaip parodyta 5 paveiksle pateiktoje vienamatėje diagramoje. Sutaupytas CFM kiekis gali būti lengvai konvertuojamas į energijos taupymą, kurį naudoja tiekimo ventiliatoriai. Karštomis ir sausomis sąlygomis, kai reikalingas garuojantis vėsinimas arba drėkinimas, naudojant mažiau oro, sunaudojama mažiau vandens. Per pastaruosius kelerius bandomojo laikotarpio metus įvairiomis oro sąlygomis galėjome sumažinti tiekiamo ventiliatoriaus energijos suvartojimą vidutiniškai 20%, o vandens suvartojimą – 4%.

5 pav. Sutaupytų oro srautų paskirstymas esant skirtingoms tiekiamo oro temperatūroms.

Šios pastangos atvėrė duris pakeisti mūsų duomenų centrų veiklą. Duomenų centruose įdiegę automatizuotas prognozes ir nuolatinį aplinkos sąlygų derinimo optimizavimą galime sulenkti sąnaudų kreivę ir sumažinti pastangas atliekant daug darbo reikalaujančias užduotis.

Meta veržiasi į naujų tipų duomenų centrus, kurie yra skirti optimizuoti dirbtiniam intelektui. Tą pačią čia pateiktą metodiką planuojame pritaikyti būsimiems duomenų centrams projektavimo etape, kad padėtume užtikrinti, kad jie būtų optimizuoti tvarumui nuo pat pirmosios jų veiklos dienos.

Taip pat šiuo metu esamuose duomenų centruose diegiame duomenų centrų aušinimo RL metodą. Per porą metų tikimės žymiai sutaupyti energijos ir vandens, prie kurio prisidėsime „Meta“ ilgalaikiai tvarumo tikslai.

Norėtume padėkoti savo partneriams IDC objekto operacijų srityje (Butchas Howardas, Randy Ridgway, Jamesas Monahanas, Chosė Montesas, Larame Cummings, Gersonas Arteaga Ramirezas, Jonas Fabianas, ir daugelis kitų) už paramą.





Source link

Draugai: - Marketingo paslaugos - Teisinės konsultacijos - Skaidrių skenavimas - Fotofilmų kūrimas - Karščiausios naujienos - Ultragarsinis tyrimas - Saulius Narbutas - Įvaizdžio kūrimas - Veidoskaita - Nuotekų valymo įrenginiai -  Padelio treniruotės - Pranešimai spaudai -