Serija Pandas može se definirati kao jednodimenzionalni niz koji može pohraniti različite vrste podataka. Lako možemo pretvoriti popis, tuple i rječnik u niz koristeći ' niz ' metoda. Oznake redova serije nazivaju se indeks. Niz ne može sadržavati više stupaca. Ima sljedeći parametar:
Stvaranje serije:
Seriju možemo kreirati na dva načina:
- Stvorite praznu seriju
- Stvorite niz pomoću ulaza.
Napravite praznu seriju:
Lako možemo stvoriti praznu seriju u Pandas, što znači da neće imati nikakvu vrijednost.
linux prečaci
Sintaksa koja se koristi za stvaranje prazne serije:
= pandas.Series()
Primjer u nastavku stvara objekt tipa Prazan niz koji nema vrijednosti i ima zadani tip podataka, tj. plovak64 .
Primjer
import pandas as pd x = pd.Series() print (x)
Izlaz
Series([], dtype: float64)
Stvaranje serije pomoću ulaza:
Serije možemo kreirati korištenjem različitih ulaza:
- Niz
- Dict
- Skalarna vrijednost
Stvaranje serije iz polja:
Prije stvaranja serije, prvo moramo uvesti numpy modul, a zatim upotrijebite funkciju array() u programu. Ako je podatak ndarray, proslijeđeni indeks mora biti iste duljine.
Ako ne proslijedimo indeks, tada je prema zadanim postavkama indeks od raspon(n) prosljeđuje se gdje n definira duljinu niza, tj. [0,1,2,.... raspon(len(niz))-1 ].
Primjer
što je svn checkout
import pandas as pd import numpy as np info = np.array(['P','a','n','d','a','s']) a = pd.Series(info) print(a)
Izlaz
0 P 1 a 2 n 3 d 4 a 5 s dtype: object
Stvorite seriju iz dict
Također možemo stvoriti seriju iz dict. Ako se objekt rječnika prosljeđuje kao ulaz, a indeks nije naveden, tada se ključevi rječnika uzimaju sortiranim redoslijedom za konstrukciju indeksa .
Ako je indeks proslijeđen, tada će vrijednosti koje odgovaraju određenoj oznaci u indeksu biti izdvojene iz rječnik .
#import the pandas library import pandas as pd import numpy as np info = {'x' : 0., 'y' : 1., 'z' : 2.} a = pd.Series(info) print (a)
Izlaz
x 0.0 y 1.0 z 2.0 dtype: float64
Stvorite niz pomoću skalara:
Ako uzmemo skalarne vrijednosti, tada se mora navesti indeks. Skalarna vrijednost će se ponoviti za podudaranje duljine indeksa.
#import pandas library import pandas as pd import numpy as np x = pd.Series(4, index=[0, 1, 2, 3]) print (x)
Izlaz
0 4 1 4 2 4 3 4 dtype: int64
Pristup podacima iz serije s pozicijom:
Nakon što stvorite objekt tipa serije, možete pristupiti njegovim indeksima, podacima, pa čak i pojedinačnim elementima.
aps c kod
Podacima u seriji može se pristupiti slično kao u ndarrayu.
import pandas as pd x = pd.Series([1,2,3],index = ['a','b','c']) #retrieve the first element print (x[0])
Izlaz
1
Atributi serijskih objekata
Atribut serije definiran je kao bilo koja informacija koja se odnosi na objekt serije kao što je veličina, tip podataka. itd. Ispod su neki od atributa koje možete koristiti za dobivanje informacija o objektu serije:
Atributi | Opis |
---|---|
Niz.indeks | Definira indeks serije. |
Serija.oblik | Vraća torku oblika podataka. |
Serija.dtype | Vraća tip podatka. |
Serija.veličina | Vraća veličinu podataka. |
Niz.prazan | Vraća True ako je objekt Series prazan, inače vraća false. |
Serije.hasnans | Vraća True ako postoje NaN vrijednosti, inače vraća false. |
Niz.nbytes | Vraća broj bajtova u podacima. |
Serija jesam | Vraća broj dimenzija u podacima. |
Serija.veličina artikla | Vraća veličinu tipa podataka stavke. |
Dohvaćanje polja indeksa i polja podataka niza objekata
Možemo dohvatiti polje indeksa i polje podataka postojećeg objekta serije pomoću atributa indeks i vrijednosti.
import numpy as np import pandas as pd x=pd.Series(data=[2,4,6,8]) y=pd.Series(data=[11.2,18.6,22.5], index=['a','b','c']) print(x.index) print(x.values) print(y.index) print(y.values)
Izlaz
RangeIndex(start=0, stop=4, step=1) [2 4 6 8] Index(['a', 'b', 'c'], dtype='object') [11.2 18.6 22.5]
Dohvaćanje tipova (dtype) i veličine tipa (itemsize)
Možete koristiti atribut dtype s objektom serije kao dtype za dohvaćanje vrste podataka pojedinačnog elementa objekta serije, možete koristiti veličina predmeta atribut za prikaz broja bajtova dodijeljenih svakoj podatkovnoj stavci.
import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6], index=['x','y','z']) print(a.dtype) print(a.itemsize) print(b.dtype) print(b.itemsize)
Izlaz
vodeni žig u wordu
int64 8 float64 8
Dohvaćanje oblika
Oblik objekta serije definira ukupan broj elemenata uključujući nedostajuće ili prazne vrijednosti (NaN).
import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6],index=['x','y','z']) print(a.shape) print(b.shape)
Izlaz
(4,) (3,)
Dohvaćanje dimenzije, veličine i broja bajtova:
import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6], index=['x','y','z']) print(a.ndim, b.ndim) print(a.size, b.size) print(a.nbytes, b.nbytes)
Izlaz
1 1 4 3 32 24
Provjera praznine i prisutnosti NaN-ova
Da biste provjerili je li objekt Series prazan, možete koristiti prazan atribut . Slično, da biste provjerili sadrži li objekt serije neke NaN vrijednosti ili ne, možete koristiti hassan atribut.
string.compareto c#
Primjer
import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,np.NaN]) b=pd.Series(data=[4.9,8.2,5.6],index=['x','y','z']) c=pd.Series() print(a.empty,b.empty,c.empty) print(a.hasnans,b.hasnans,c.hasnans) print(len(a),len(b)) print(a.count( ),b.count( ))
Izlaz
False False True True False False 4 3 3 3
Funkcije serije
Postoje neke funkcije koje se koriste u seriji, a to su:
Funkcije | Opis |
---|---|
Pandas Series.map() | Mapirajte vrijednosti iz dva niza koji imaju zajednički stupac. |
Pandas Series.std() | Izračunajte standardnu devijaciju zadanog skupa brojeva, DataFramea, stupca i redaka. |
Pandas Series.to_frame() | Pretvorite objekt serije u podatkovni okvir. |
Pandas Series.value_counts() | Vraća niz koji sadrži brojeve jedinstvenih vrijednosti. |