logo

Što je crveni pomak?

  • Redshift je brza i moćna, potpuno upravljana usluga skladištenja podataka veličine petabajta u oblaku.
  • Kupci mogu koristiti Redshift za samo 0,25 USD po satu bez obveza ili početnih troškova i skalirati na petabajt ili više za 1000 USD po terabajtu godišnje.

OLAP

OLAP je Sustav za online analitičku obradu korišten od strane Crveni pomak .

Primjer OLAP transakcije:

Pretpostavimo da želimo izračunati neto dobit za EMEA i Pacifik za digitalni radio proizvod. To zahtijeva povlačenje velikog broja zapisa. Slijede zapisi potrebni za izračun neto dobiti:

  • Ukupan broj radija prodanih u EMEA.
  • Broj radio uređaja prodanih na Pacifiku.
  • Jedinična cijena radija u svakoj regiji.
  • Prodajna cijena svakog radija
  • Prodajna cijena - jedinični trošak

Za dohvaćanje gore navedenih zapisa potrebni su složeni upiti. Baze podataka skladištenja podataka koriste različite tipove arhitekture i iz perspektive baze podataka i iz infrastrukturnog sloja.

Konfiguracija crvenog pomaka

Crveni pomak

Crveni pomak se sastoji od dvije vrste čvorova:

    Jednostruki čvor Više čvorova

Jedan čvor: Jedan čvor pohranjuje do 160 GB.

Više čvorova: Multi-čvor je čvor koji se sastoji od više od jednog čvora. Ima dvije vrste:

    Vodeći čvor
    Upravlja vezama klijenata i prima upite. Vodeći čvor prima upite od klijentskih aplikacija, analizira upite i razvija planove izvršenja. Usklađuje se s paralelnim izvođenjem ovih planova s ​​računalnim čvorom i kombinira međurezultate svih čvorova, a zatim vraća konačni rezultat klijentskoj aplikaciji.Računalni čvor
    Računalni čvor izvršava planove izvršenja, a zatim se međurezultati šalju vodećem čvoru na agregaciju prije slanja natrag klijentskoj aplikaciji. Može imati do 128 računalnih čvorova.

Razumimo koncept vodećeg čvora i računskih čvorova kroz primjer.

Crveni pomak

Redshift skladište je zbirka računalnih resursa poznatih kao čvorovi, a ti su čvorovi organizirani u grupu poznatu kao klaster. Svaki klaster radi u Redshift Engineu koji sadrži jednu ili više baza podataka.

Kada pokrenete Redshift instancu, ona počinje s jednim čvorom veličine 160 GB. Kada želite rasti, možete dodati dodatne čvorove kako biste iskoristili prednosti paralelne obrade. Imate vodeći čvor koji upravlja višestrukim čvorovima. Vodeći čvor upravlja vezom klijenta kao i računalnim čvorovima. Pohranjuje podatke u računalne čvorove i izvršava upit.

Zašto je Redshift 10 puta brži

Crveni pomak je 10 puta brži zbog sljedećih razloga:

    Pohrana podataka u stupcima
    Umjesto pohranjivanja podataka kao niza redaka, Amazon Redshift organizira podatke po stupcima. Sustavi temeljeni na redovima idealni su za obradu transakcija, dok su sustavi temeljeni na stupcima idealni za skladištenje podataka i analitiku, gdje upiti često uključuju agregate koji se izvode nad velikim skupovima podataka. Budući da se obrađuju samo stupci uključeni u upite, a podaci u stupcima pohranjuju se u mediju za pohranu sekvencijalno, sustavi koji se temelje na stupcima zahtijevaju manje I/O-a, čime se poboljšava izvedba upita.Napredna kompresija
    Pohrane podataka u stupcima mogu se komprimirati mnogo više nego pohrane podataka temeljene na retku jer se slični podaci pohranjuju sekvencijalno na disku. Amazon Redshift koristi više tehnika kompresije i često može postići značajnu kompresiju u odnosu na tradicionalne relacijske pohrane podataka.
    Amazon Redshift ne zahtijeva indekse ili materijalizirane prikaze pa zahtijeva manje prostora od tradicionalnih sustava relacijskih baza podataka. Prilikom učitavanja podataka u praznu tablicu, Amazon Redshift automatski uzorkuje vaše podatke i odabire najprikladniju tehniku ​​kompresije.Masivna paralelna obrada
    Amazon Redshift automatski distribuira podatke i učitava upit kroz različite čvorove. Amazon Redshift olakšava dodavanje novih čvorova u vaše skladište podataka, a to nam omogućuje postizanje brže izvedbe upita kako vaše skladište podataka raste.

Značajke crvenog pomaka

Značajke crvenog pomaka navedene su u nastavku:

shreya ghosal
Crveni pomak
    Jednostavan za postavljanje, implementaciju i upravljanje
      Automatizirano dodjeljivanje
      Redshift je jednostavan za postavljanje i rukovanje. Možete implementirati novo skladište podataka sa samo nekoliko klikova na AWS konzoli, a Redshift automatski osigurava infrastrukturu za vas. U AWS-u su svi administrativni zadaci automatizirani, poput sigurnosnih kopija i replikacije, morate se usredotočiti na svoje podatke, a ne na administraciju.Automatizirano sigurnosno kopiranje
      Redshift automatski stvara sigurnosnu kopiju vaših podataka na S3. Također možete replicirati snimke u S3 u drugoj regiji za bilo koji oporavak od katastrofe.
    Isplativ
      Nema troškova unaprijed, plaćajte u hodu
      Amazon Redshift najisplativiji je servis za skladištenje podataka jer morate platiti samo ono što koristite.
      Njegovi troškovi počinju s 0,25 USD po satu bez obveze i troškova unaprijed i mogu se povećati na 250 USD po terabajtu godišnje.
      Amazon Redshift jedina je usluga skladišta podataka koja nudi cijene na zahtjev bez ikakvih početnih troškova, a također nudi cijene rezerviranih instanci koje štede do 75% pružanjem roka od 1-3 godine.Odaberite vrstu čvora.
      Možete odabrati bilo koji od dva čvora za optimizaciju crvenog pomaka.
        Gusti računski čvor
        Gusti računalni čvor može stvoriti skladišta podataka visokih performansi upotrebom brzih procesora, velike količine RAM-a i solid-state diskova.Čvor za gustu pohranu
        Ako želite smanjiti troškove, tada možete koristiti Dense storage node. Korištenjem većeg tvrdog diska stvara isplativo skladište podataka.
    Brzo prilagodite svoje potrebe.
      Skladištenje podataka veličine petabajta
      Amazon Redshift automatski povećava ili smanjuje čvorove prema promjenama potreba. Sa samo nekoliko klikova u AWS konzoli ili jednim API pozivom možete jednostavno promijeniti broj čvorova u skladištu podataka.Analitika podatkovnog jezera na razini eksabajta
      To je značajka Redshifta koja vam omogućuje pokretanje upita prema egzabajtima podataka u Amazonu S3. Amazon S3 siguran je i isplativ podatkovni uređaj za pohranu neograničenih podataka u otvorenom formatu.Neograničena konkurentnost
      To je značajka Redshifta što znači da višestruki upiti mogu pristupiti istim podacima u Amazonu S3. Omogućuje vam pokretanje upita preko više čvorova bez obzira na složenost upita ili količinu podataka.
    Upitajte svoje podatkovno jezero
    Amazon Redshift jedino je skladište podataka koje se koristi za upite u podatkovnom jezeru Amazon S3 bez učitavanja podataka. Ovo pruža fleksibilnost pohranjivanjem podataka kojima se često pristupa u Redshift i nestrukturiranih podataka ili podataka kojima se rijetko pristupa u Amazon S3.Siguran
    Uz nekoliko postavki parametara, možete postaviti Redshift da koristi SSL za zaštitu vaših podataka. Također možete omogućiti enkripciju, svi podaci zapisani na disk će biti šifrirani.Brži učinak
    Amazon Redshift omogućuje pohranu podataka u stupcima, kompresiju i paralelnu obradu kako bi se smanjila količina I/O potrebna za izvođenje upita. To poboljšava izvedbu upita.