Learn practical skills, build real-world projects, and advance your career

Imgur

Data Science va Sun'iy Intellekt Praktikum

3-MODUL. MA’LUMOTLARGA ISHLOV BERISH

3.2 Ma'lumotlarni tozalash va tayyorlash

Guruhlash

Guruhlashning vazifasi ma'lumotlarni tahlil qilish uchun biror ustun qiymatlarini berilgan oraliqlarga (guruhlarga) tushurib olish.

Misol uchun, sizda foydalanuvchilar haqida ma'lumotlar jamlangan va u yerda har bir foydalanuvchining yoshi ham ko'rsatilgan. Siz foydalanuvchilarni qaysi yosh oralig'ida ekanini (qaysi guruhga tegishli ekanini) ko'rmoqchisiz:

alt

Yuqoridagi kabi natijani olish uchun biz foydalanauvchilarni yosihga qarab ma'lum oraliqqa joylashimiz kerak, pandas bu jarayonni bir muncha osonlashtiradi.

import pandas as pd
df = pd.read_csv('https://raw.githubusercontent.com/anvarnarz/praktikum_datasets/main/world_population_duplicates.csv', usecols=['country','pop2021','area'], index_col='country')
df.head()

Takrorlanishlarni o'chirib yuboramiz:

df.drop_duplicates(inplace=True)