Graded Quiz: Data Wrangling :Data Analysis with Python (IBM Data Analyst Professional Certificate) Answers 2025

1. Question 1

Method to replace missing values for continuous attributes:

For continuous variables, the most common imputation method is using the mean (average).

First step when deciding bin values for continuous data:

You must first understand the distribution before creating bins.

Most appropriate data type for city names like “N.Y.”, “Ny”, “New York”:

Non-numeric text values in Pandas are stored as object type.

Primary purpose of normalization:

Normalization adjusts scale, preventing large-range features from dominating.

Converting categorical values into numerical values:

Encoding transforms categories into machine-learning friendly numbers.

First step in data preparation:

Cleaning always comes first to ensure data reliability.

Prepare “fuel type” column (gas/diesel) for model training:

get_dummies() performs one-hot encoding for categorical variables.

Convert “N/A” text entries into actual NaN values:

Use replace("N/A", np.nan) to convert string placeholders to true missing values.

Q	Correct Answer	Key Concept
1	Mean imputation	Continuous missing value handling
2	Visualize distribution	Bin selection
3	object	Text data storage
4	Similar feature ranges	Normalization purpose
5	Encode categories → numbers	ML preprocessing
6	Clean data first	Data pipeline
7	get_dummies()	One-hot encoding
8	replace()	Converting placeholders to NaN