Learn practical skills, build real-world projects, and advance your career
Created 2 years ago
Data Science va Sun'iy Intellekt Praktikum
3-MODUL. MA’LUMOTLARGA ISHLOV BERISH
3.2 Ma'lumotlarni tozalash va tayyorlash
Guruhlash
Guruhlashning vazifasi ma'lumotlarni tahlil qilish uchun biror ustun qiymatlarini berilgan oraliqlarga (guruhlarga) tushurib olish.
Misol uchun, sizda foydalanuvchilar haqida ma'lumotlar jamlangan va u yerda har bir foydalanuvchining yoshi ham ko'rsatilgan. Siz foydalanuvchilarni qaysi yosh oralig'ida ekanini (qaysi guruhga tegishli ekanini) ko'rmoqchisiz:
Yuqoridagi kabi natijani olish uchun biz foydalanauvchilarni yosihga qarab ma'lum oraliqqa joylashimiz kerak, pandas
bu jarayonni bir muncha osonlashtiradi.
import pandas as pd
df = pd.read_csv('https://raw.githubusercontent.com/anvarnarz/praktikum_datasets/main/world_population_duplicates.csv', usecols=['country','pop2021','area'], index_col='country')
df.head()
Takrorlanishlarni o'chirib yuboramiz:
df.drop_duplicates(inplace=True)