Akademisyenler öncülüğünde matematik/fizik/bilgisayar bilimleri soru cevap platformu
0 beğenilme 0 beğenilmeme
2k kez görüntülendi

Aşağıdaki pandas veri setinden Client id, Client name, Full_Address sütunları tekrar eden satırları atmak istiyorum.

Client_id Client_Name Address1        Address3       Post_Code   City_Name              Full_Address                            

 C0000001     A       10000009    37 RUE DE LA GARE    L-7535      MERSCH       37 RUE DE LA GARE,L-7535, MERSCH     
 C0000001     A       10000009    37 RUE DE LA GARE    L-7535      MERSCH       37 RUE DE LA GARE,L-7535, MERSCH     
 C0000001     A       10000009    37 RUE DE LA GARE    L-7535      MERSCH       37 RUE DE LA GARE,L-7535, MERSCH     
 C0000002     B       10001998  RUE EDWARD STEICHEN    L-1855  LUXEMBOURG  RUE EDWARD STEICHEN,L-1855,LUXEMBOURG     
 C0000002     B       10001998  RUE EDWARD STEICHEN    L-1855  LUXEMBOURG  RUE EDWARD STEICHEN,L-1855,LUXEMBOURG     
 C0000002     B       10001998  RUE EDWARD STEICHEN    L-1855  LUXEMBOURG  RUE EDWARD STEICHEN,L-1855,LUXEMBOURG     
 C0000003     C       11000051       9 RUE DU BRILL    L-3898       FOETZ           9 RUE DU BRILL,L-3898 ,FOETZ     
 C0000003     C       11000051       9 RUE DU BRILL    L-3898       FOETZ           9 RUE DU BRILL,L-3898 ,FOETZ     
 C0000003     C       11000051       9 RUE DU BRILL    L-3898       FOETZ           9 RUE DU BRILL,L-3898 ,FOETZ     
 C0000004     D       10000009    37 RUE DE LA GARE    L-7535      MERSCH       37 RUE DE LA GARE,L-7535, MERSCH     
 C0000005     E       10001998  RUE EDWARD STEICHEN    L-1855  LUXEMBOURG  RUE EDWARD STEICHEN,L-1855,LUXEMBOURG     

Beklediğim çıktı:

Client_id Client_Name Address1        Address3       Post_Code   City_Name              Full_Address                            
 C0000001     A       10000009    37 RUE DE LA GARE    L-7535     MERSCH           37 RUE DE LA GARE,L-7535, MERSCH            
 C0000002     B       10001998    RUE EDWARD STEICHEN  L-1855     LUXEMBOURG       RUE EDWARD STEICHEN,L-1855,LUXEMBOURG         
 C0000003     C       11000051    9 RUE DU BRILL       L-3898     FOETZ            9 RUE DU BRILL,L-3898 ,FOETZ         
 C0000004     D       10000009    37 RUE DE LA GARE    L-7535     MERSCH           37 RUE DE LA GARE,L-7535, MERSCH     
 C0000005     E       10001998    RUE EDWARD STEICHEN  L-1855     LUXEMBOURG       RUE EDWARD STEICHEN,L-1855,LUXEMBOURG     

 

Veri Bilimi kategorisinde (1.8k puan) tarafından 
tarafından düzenlendi | 2k kez görüntülendi

1 cevap

0 beğenilme 0 beğenilmeme

Pandas'ın drop_duplicates() methodu ile (veri setinin adı df):

df.drop_duplicates(subset=["Client_id", "Client_name", "Full_Address"])

Ayrıca tekrar eden ilk ya da son satırı seçmek de mümkün.

df.drop_duplicates(subset=["Client_id", "Client_name", "Full_Address"], keep="first") # "first" ya da "last"

 

(1.8k puan) tarafından 
20,284 soru
21,823 cevap
73,508 yorum
2,569,934 kullanıcı