数据分析技术题库

数据分析基础 0/5 (0%)

编程题
1
数据分析流程
中等 20分钟
2
缺失值处理
简单 15分钟
3
异常值检测
中等 20分钟
选择题
A
数据分析定义
简单 选择题
B
CRISP-DM方法论
简单 选择题

数据准备与清洗 0/4 (0%)

核心工具实操 0/4 (0%)

统计分析方法 0/5 (0%)

高级数据分析 0/3 (0%)

数据可视化 0/2 (0%)

行业实战案例 0/2 (0%)

课程总结 0/1 (0%)

问题1:缺失值处理

00:00
简单

编写一个程序,使用Pandas处理DataFrame中的缺失值。

输入:

一个包含缺失值的DataFrame

输出:

处理后的DataFrame,其中缺失值已被适当处理

要求:

  • 识别并统计缺失值
  • 使用合适的方法填充缺失值(如均值、中位数或众数)
  • 返回处理后的DataFrame

代码编辑器

正在加载Python解释器...

运行结果

执行时间:0ms 内存:0MB
运行代码查看输出...

答案解析

解题思路

1. 使用Pandas的isnull()和sum()方法识别并统计缺失值

2. 根据数据类型选择合适的填充方法:数值型数据使用均值或中位数,分类型数据使用众数

3. 使用fillna()方法填充缺失值

代码示例

import pandas as pd
import numpy as np

# 创建示例数据
data = {
    'A': [1, 2, np.nan, 4, 5],
    'B': [np.nan, 2, 3, 4, np.nan],
    'C': ['x', 'y', 'z', np.nan, 'x']
}
df = pd.DataFrame(data)

# 识别缺失值
print("缺失值统计:")
print(df.isnull().sum())

# 处理缺失值
df['A'] = df['A'].fillna(df['A'].mean())
df['B'] = df['B'].fillna(df['B'].median())
df['C'] = df['C'].fillna(df['C'].mode()[0])

print("\n处理后的数据:")
print(df)
                    

知识点