logo

Spajanje pandi

Pandas je sposoban kombinirati objekte Series, DataFrame i Panel kroz različite vrste skupne logike za indekse i funkcionalnost relacijske algebre.

The concat() odgovorna je za izvođenje operacije ulančavanja duž osi u DataFrameu.

Sintaksa:

 pd.concat(objs,axis=0,join='outer',join_axes=None, ignore_index=False) 

Parametri:

    cilj:To je slijed ili mapiranje serije ili DataFrame objekata.
    Ako prenesemo dict u DataFrame, tada će se sortirani ključevi koristiti kao ključevi argument, a vrijednosti će biti odabrane u tom slučaju. Ako su prisutni bilo koji ne-objekti, tada će biti odbačeni osim ako svi nisu nijedan, a u ovom slučaju, ValueError bit će podignuta.os:To je os duž koje se spaja.pridružiti:Odgovoran za rukovanje indeksima na drugoj osi.spojne osi:Popis indeksnih objekata. Umjesto izvođenja logike unutarnjeg ili vanjskog skupa, specifični indeksi koriste se za drugu (n-1) os.ignore_index:bool, zadana vrijednost False
    Ne koristi vrijednosti indeksa na osi ulančavanja, ako je istina. Rezultirajuća os će biti označena kao 0, ..., n - 1.

Povratak

Niz se vraća kada spojimo sve nizove duž osi (os=0). U slučaju ako objs sadrži barem jedan DataFrame, vraća DataFrame.

Primjer1:

 import pandas as pd a_data = pd.Series(['p', 'q']) b_data = pd.Series(['r', 's']) pd.concat([a_data, b_data]) 

Izlaz

 0 p 1 q 0 r 1 s dtype: object 

Primjer2: U gornjem primjeru možemo resetirati postojeći indeks pomoću indeks_ignoriranja parametar. Donji kod pokazuje rad indeks_ignoriranja .

excel uklonite prvi znak
 import pandas as pd a_data = pd.Series(['p', 'q']) b_data = pd.Series(['r', 's']) pd.concat([a_data, b_data], ignore_index=True) 

Izlaz

 0 p 1 q 2 r 3 s dtype: object 

Primjer 3: Možemo dodati hijerarhijski indeks na krajnjoj vanjskoj razini podataka pomoću ključevi parametar.

 import pandas as pd a_data = pd.Series(['p', 'q']) b_data = pd.Series(['r', 's']) pd.concat([a_data, b_data], keys=['a_data', 'b_data']) 

Izlaz

gumb tkinter
 a_data 0 p 1 q b_data 0 r 1 s dtype: object 

Primjer 4: Ključeve indeksa možemo označiti pomoću imena parametar. Donji kod prikazuje rad parametra imena.

 import pandas as pd a_data = pd.Series(['p', 'q']) b_data = pd.Series(['r', 's']) pd.concat([a_data, b_data], keys=['a_data', 'b_data']) pd.concat([a_data, b_data], keys=['a_data', 'b_data'], names=['Series name', 'Row ID']) 

Izlaz

 Series name Row ID a_data 0 p 1 q b_data 0 r 1 s dtype: object 

Ulančavanje pomoću dodavanja

Metoda dodavanja definirana je kao koristan prečac za spajanje Serije i DataFramea.

Primjer:

 import pandas as pd one = pd.DataFrame({ 'Name': ['Parker', 'Smith', 'Allen', 'John', 'Parker'], 'subject_id':['sub1','sub2','sub4','sub6','sub5'], 'Marks_scored':[98,90,87,69,78]}, index=[1,2,3,4,5]) two = pd.DataFrame({ 'Name': ['Billy', 'Brian', 'Bran', 'Bryce', 'Betty'], 'subject_id':['sub2','sub4','sub3','sub6','sub5'], 'Marks_scored':[89,80,79,97,88]}, index=[1,2,3,4,5]) print (one.append(two)) 

Izlaz

 Name subject_id Marks_scored 1 Parker sub1 98 2 Smith sub2 90 3 Allen sub4 87 4 John sub6 69 5 Parker sub5 78 1 Billy sub2 89 2 Brian sub4 80 3 Bran sub3 79 4 Bryce sub6 97 5 Betty sub5 88