Lead Scoring Case Study - Notebook by Souptik Majumder (souptik-reach-095)

Learn practical skills, build real-world projects, and advance your career

Created 5 years ago

import jovian

#importing libraries
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns

#read data
df = pd.read_csv('Leads.csv')
df.head()

df.shape #rows and columns of dataframe

(9240, 37)

#percentage of null values in each column
null_val = []
for x in df.columns: 
    null_val.append(round(df[x].isna().sum()/len(df[x]) *100,2))
null_df = pd.DataFrame([df.columns,null_val]).T   
null_df.columns = ['Columns','Missing values']
null_df['Missing values'].head()

0       0
1       0
2       0
3    0.39
4       0
Name: Missing values, dtype: object