数据采集与处理题库

HTTP请求基础 0/6 (0%)

编程题
1
简单HTTP请求
简单 15分钟
2
请求头设置
中等 20分钟
3
状态码处理
中等 15分钟
选择题
A
HTTP方法
简单 选择题
B
状态码含义
中等 选择题
C
请求头
简单 选择题

HTML解析 0/4 (0%)

正则表达式 0/4 (0%)

数据存储 0/1 (0%)

反爬虫策略 0/1 (0%)

高级爬虫 0/3 (0%)

问题1:缺失值处理

00:00
简单

编写一个程序,使用Pandas处理DataFrame中的缺失值。

输入:

一个包含缺失值的DataFrame

输出:

处理后的DataFrame,其中缺失值已被适当处理

要求:

  • 识别并统计缺失值
  • 使用合适的方法填充缺失值(如均值、中位数或众数)
  • 返回处理后的DataFrame

代码编辑器

正在加载Python解释器...

运行结果

执行时间:0ms 内存:0MB
运行代码查看输出...

答案解析

解题思路

1. 使用Pandas的isnull()和sum()方法识别并统计缺失值

2. 根据数据类型选择合适的填充方法:数值型数据使用均值或中位数,分类型数据使用众数

3. 使用fillna()方法填充缺失值

代码示例

import pandas as pd
import numpy as np

# 创建示例数据
data = {
    'A': [1, 2, np.nan, 4, 5],
    'B': [np.nan, 2, 3, 4, np.nan],
    'C': ['x', 'y', 'z', np.nan, 'x']
}
df = pd.DataFrame(data)

# 识别缺失值
print("缺失值统计:")
print(df.isnull().sum())

# 处理缺失值
df['A'] = df['A'].fillna(df['A'].mean())
df['B'] = df['B'].fillna(df['B'].median())
df['C'] = df['C'].fillna(df['C'].mode()[0])

print("\n处理后的数据:")
print(df)
                    

知识点