logo

Serija Python Pandas

Serija Pandas može se definirati kao jednodimenzionalni niz koji može pohraniti različite vrste podataka. Lako možemo pretvoriti popis, tuple i rječnik u niz koristeći ' niz ' metoda. Oznake redova serije nazivaju se indeks. Niz ne može sadržavati više stupaca. Ima sljedeći parametar:

    podaci:To može biti bilo koji popis, rječnik ili skalarna vrijednost.indeks:Vrijednost indeksa treba biti jedinstvena i hashable. Mora biti iste duljine kao podaci. Ako ne proslijedimo nijedan indeks, zadano np.rasporedi(n) koristit će se.dtype:Odnosi se na vrstu podataka serije.kopirati:Koristi se za kopiranje podataka.

Stvaranje serije:

Seriju možemo kreirati na dva načina:

  1. Stvorite praznu seriju
  2. Stvorite niz pomoću ulaza.

Napravite praznu seriju:

Lako možemo stvoriti praznu seriju u Pandas, što znači da neće imati nikakvu vrijednost.

linux prečaci

Sintaksa koja se koristi za stvaranje prazne serije:

 = pandas.Series() 

Primjer u nastavku stvara objekt tipa Prazan niz koji nema vrijednosti i ima zadani tip podataka, tj. plovak64 .

Primjer

 import pandas as pd x = pd.Series() print (x) 

Izlaz

 Series([], dtype: float64) 

Stvaranje serije pomoću ulaza:

Serije možemo kreirati korištenjem različitih ulaza:

  • Niz
  • Dict
  • Skalarna vrijednost

Stvaranje serije iz polja:

Prije stvaranja serije, prvo moramo uvesti numpy modul, a zatim upotrijebite funkciju array() u programu. Ako je podatak ndarray, proslijeđeni indeks mora biti iste duljine.

Ako ne proslijedimo indeks, tada je prema zadanim postavkama indeks od raspon(n) prosljeđuje se gdje n definira duljinu niza, tj. [0,1,2,.... raspon(len(niz))-1 ].

Primjer

što je svn checkout
 import pandas as pd import numpy as np info = np.array(['P','a','n','d','a','s']) a = pd.Series(info) print(a) 

Izlaz

 0 P 1 a 2 n 3 d 4 a 5 s dtype: object 

Stvorite seriju iz dict

Također možemo stvoriti seriju iz dict. Ako se objekt rječnika prosljeđuje kao ulaz, a indeks nije naveden, tada se ključevi rječnika uzimaju sortiranim redoslijedom za konstrukciju indeksa .

Ako je indeks proslijeđen, tada će vrijednosti koje odgovaraju određenoj oznaci u indeksu biti izdvojene iz rječnik .

 #import the pandas library import pandas as pd import numpy as np info = {'x' : 0., 'y' : 1., 'z' : 2.} a = pd.Series(info) print (a) 

Izlaz

 x 0.0 y 1.0 z 2.0 dtype: float64 

Stvorite niz pomoću skalara:

Ako uzmemo skalarne vrijednosti, tada se mora navesti indeks. Skalarna vrijednost će se ponoviti za podudaranje duljine indeksa.

 #import pandas library import pandas as pd import numpy as np x = pd.Series(4, index=[0, 1, 2, 3]) print (x) 

Izlaz

 0 4 1 4 2 4 3 4 dtype: int64 

Pristup podacima iz serije s pozicijom:

Nakon što stvorite objekt tipa serije, možete pristupiti njegovim indeksima, podacima, pa čak i pojedinačnim elementima.

aps c kod

Podacima u seriji može se pristupiti slično kao u ndarrayu.

 import pandas as pd x = pd.Series([1,2,3],index = ['a','b','c']) #retrieve the first element print (x[0]) 

Izlaz

 1 

Atributi serijskih objekata

Atribut serije definiran je kao bilo koja informacija koja se odnosi na objekt serije kao što je veličina, tip podataka. itd. Ispod su neki od atributa koje možete koristiti za dobivanje informacija o objektu serije:

Atributi Opis
Niz.indeks Definira indeks serije.
Serija.oblik Vraća torku oblika podataka.
Serija.dtype Vraća tip podatka.
Serija.veličina Vraća veličinu podataka.
Niz.prazan Vraća True ako je objekt Series prazan, inače vraća false.
Serije.hasnans Vraća True ako postoje NaN vrijednosti, inače vraća false.
Niz.nbytes Vraća broj bajtova u podacima.
Serija jesam Vraća broj dimenzija u podacima.
Serija.veličina artikla Vraća veličinu tipa podataka stavke.

Dohvaćanje polja indeksa i polja podataka niza objekata

Možemo dohvatiti polje indeksa i polje podataka postojećeg objekta serije pomoću atributa indeks i vrijednosti.

 import numpy as np import pandas as pd x=pd.Series(data=[2,4,6,8]) y=pd.Series(data=[11.2,18.6,22.5], index=['a','b','c']) print(x.index) print(x.values) print(y.index) print(y.values) 

Izlaz

 RangeIndex(start=0, stop=4, step=1) [2 4 6 8] Index(['a', 'b', 'c'], dtype='object') [11.2 18.6 22.5] 

Dohvaćanje tipova (dtype) i veličine tipa (itemsize)

Možete koristiti atribut dtype s objektom serije kao dtype za dohvaćanje vrste podataka pojedinačnog elementa objekta serije, možete koristiti veličina predmeta atribut za prikaz broja bajtova dodijeljenih svakoj podatkovnoj stavci.

 import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6], index=['x','y','z']) print(a.dtype) print(a.itemsize) print(b.dtype) print(b.itemsize) 

Izlaz

vodeni žig u wordu
 int64 8 float64 8 

Dohvaćanje oblika

Oblik objekta serije definira ukupan broj elemenata uključujući nedostajuće ili prazne vrijednosti (NaN).

 import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6],index=['x','y','z']) print(a.shape) print(b.shape) 

Izlaz

 (4,) (3,) 

Dohvaćanje dimenzije, veličine i broja bajtova:

 import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6], index=['x','y','z']) print(a.ndim, b.ndim) print(a.size, b.size) print(a.nbytes, b.nbytes) 

Izlaz

 1 1 4 3 32 24 

Provjera praznine i prisutnosti NaN-ova

Da biste provjerili je li objekt Series prazan, možete koristiti prazan atribut . Slično, da biste provjerili sadrži li objekt serije neke NaN vrijednosti ili ne, možete koristiti hassan atribut.

string.compareto c#

Primjer

 import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,np.NaN]) b=pd.Series(data=[4.9,8.2,5.6],index=['x','y','z']) c=pd.Series() print(a.empty,b.empty,c.empty) print(a.hasnans,b.hasnans,c.hasnans) print(len(a),len(b)) print(a.count( ),b.count( )) 

Izlaz

 False False True True False False 4 3 3 3 

Funkcije serije

Postoje neke funkcije koje se koriste u seriji, a to su:

Funkcije Opis
Pandas Series.map() Mapirajte vrijednosti iz dva niza koji imaju zajednički stupac.
Pandas Series.std() Izračunajte standardnu ​​devijaciju zadanog skupa brojeva, DataFramea, stupca i redaka.
Pandas Series.to_frame() Pretvorite objekt serije u podatkovni okvir.
Pandas Series.value_counts() Vraća niz koji sadrži brojeve jedinstvenih vrijednosti.