后端 #12450
需求 #12447: 上汽大众数仓相关开发及运维
对话系统POC数据提供
描述
1、需求背景:
(1)对话系统POC需要:需要取部分生产环境数据复制导出到测试环境,供相关供应商团队进行数据流程验证,到时候按照像之前一样的【数仓生产-Oracle生产-Oracle测试-数仓测试】的方式把数据弄到数仓测试环境
(2)企微对话格式改造的数据验证,除了奥迪品牌,大众品牌也希望有类似的改造
2、数据需求:
(1)前处理宽表:voc_dwd_pre_integration_di_poc202505
(2)品牌渠道:大众:企微、DCC、工牌;奥迪:企微、DCC
(3)优先级高:奥迪,2025-06-19~2025-06-22,企微、DCC、工牌,希望本周(20250627前)宽表出来
优先级低:大众,2025-05-01~2025-05-31,企微、DCC、工牌
(4)定开需求:企微都按照奥迪目前的对话切分逻辑应用于大众和奥迪,企微、DCC、工牌的content格式都同当前的DCC。除了对话格式的改造,数仓前置处理规则都要尽可能简化,只保留类似于content长度小于5这种特别简单的规则。在ext_data中,需要提现各源数据中的意向车系名称(不能是VOC自己创建的编码)和意向等级等字段,还有用户的OneID
工牌渠道的ext_data字段需要带上:意向车系编码、意向车系名称、场景(展厅接待、试乘试驾、车辆交付)、意向等级