要自定义编码方案,可以使用map()
函数来实现。首先创建一个字典,将原始数据和自定义编码进行映射,然后使用map()
函数将原始数据映射为自定义编码。以下是一个示例:
import pandas as pd
# 创建一个包含原始数据的DataFrame
data = {'A': ['apple', 'banana', 'cherry', 'apple', 'banana']}
df = pd.DataFrame(data)
# 创建自定义编码字典
encoding = {'apple': 1, 'banana': 2, 'cherry': 3}
# 使用map函数将原始数据映射为自定义编码
df['A_encoded'] = df['A'].map(encoding)
print(df)
输出结果为:
A A_encoded
0 apple 1
1 banana 2
2 cherry 3
3 apple 1
4 banana 2
这样就实现了自定义的编码方案。