项目

一般

简介

后端 #16984

公域数据降噪与增量优化

雷文武8 天 之前添加. 更新于 8 天 之前.

状态:
开发中
优先级:
普通
指派给:
开始日期:
2025-12-03
计划完成日期:
2025-12-19
% 完成:

0%

预期时间:
等级:
简单
变更任务:
版本:

描述

· 火山侧每天采集约 120w 条公域数据

· 模型实际成功打标的数据量仅 10w+

· 假设模型本身无问题,则:

至少 80% 为噪音/广告/业务无关内容

从采集入口与数据清洗环节减少无效数据,降低模型GPU使用资源

历史记录

#1

雷文武 更新于 8 天 之前

  • 状态待处理 变更为 开发中

导出 Atom PDF