type
Post
status
Published
date
Apr 17, 2026
slug
python005
summary
tags
python
category
python
icon
password
example-row
LightGBM推理训练完成后会生成lightgbm_model.txtcategory_encoder.pklfeature_meta.json 文件。这三个文件是 LightGBM 模型训练的标准产物,推理时必须同时加载。
1. lightgbm_model.txt - LightGBM 模型文件
  • 用途:保存训练好的 LightGBM 模型参数和结构。
  • 内容:决策树的结构、叶子节点的权重、超参数等。
  • 使用lgb.Booster(model_file=...) 加载模型后可以调用 predict() 进行推理。
2. category_encoder.pkl - 类别编码器
  • 用途:将类别特征(如"上海市"、"个人客户")转换为数值编码。
  • 内容:训练时学习的类别到数值的映射关系。
  • 使用:推理时用 encoder.transform() 将新的类别特征转换为模型可用的数值。
  • 格式.pkl 是 Python pickle 格式,用 joblib.load() 加载。
3. feature_meta.json - 特征元数据
  • 用途:描述特征的结构信息。
  • 内容
    • num_cols:数值特征列名列表。
    • cat_cols:类别特征列名列表。
  • 使用:推理时根据这些列名拆分数值特征和类别特征。

类比:

  • lightgbm_model.txt:训练好的"大脑"
  • category_encoder.pkl:词汇表(将文字转为数字)
  • feature_meta.json:说明书(告诉程序哪些列是文字,哪些是数字)

推理流程:

 
【python004】@dataclass装饰器【blog001】Windows下hexo+github
Loading...