在本地生活服务领域,大模型技术落地正遭遇 “三重困境”:通用能力与领域需求难以适配,复杂场景下服务可靠性与个性化无法兼顾,高昂的数据成本与漫长的训练周期进一步增加了开发难度。更关键的是,行业内缺乏可复用的业务适配框架与真实场景优化方案,导致技术落地效率较低。
如何打破僵局,实现 “体验与效率” 的极致平衡?成为了行业共同面临的难题。
基于此,结合美团自身在智能客服、多业务场景落地的实战经验,LongCat团队正式发布——「WOWService 大模型交互系统技术报告」,深度拆解了 「数据与知识双驱动」「自我优化训练」「四阶段训练流水线」「多 Agent 协同」 四大核心技术框架,希望对行业发展提供参考与启发。
▶ 技术报告连接:https://arxiv.org/pdf/2510.13291
WOWService系统融合多智能体协同、强化学习、领域知识增强等前沿技术,显著提升了推理能力和业务场景的专业度。通过人机协同标注、模型自我批判强化及知识重写,WOWService在复杂指令处理和多任务场景下表现出更强的灵活性与深度。仅需10%的小模型标注数据即可达到传统方案相当的效果,有效降低了训练成本和周期。
在实际业务应用方面,WOWService已经主要落地在美团智能客服系统,并广泛覆盖美团内部的数十个业务场景,构建了高质量海量多轮对话数据,并完善了数据构建体系。系统通过持续优化和创新,不仅显著提升了用户满意度和业务运营效率,还在11项关键指标上全面超越了Base模型,充分展现了其在实际业务场景中的卓越优势。WOWService的落地应用有效助力美团实现智能化服务升级,推动了企业在多元业务场景下的持续创新与高效运营。
WOWService智能交互系统通过数据与知识双驱动机制,自我优化训练机制、四阶段多层次训练流程、多Agent协同机制和人机协同评估体系,深度融合业务知识与真实交互数据,实现模型自我进化和高质量服务落地,有效提升知识遵循、业务合规性和用户体验。
WOWService通过“数据驱动与知识驱动相结合”的混合策略,将结构化业务知识(如规则库、流程规范等)与大规模真实交互数据深度融合,优化知识与数据集的比例,从而在模型训练过程中强化对业务规则和知识点的遵循能力。系统在混合驱动流程中应用强化学习等技术,进一步提升模型对基于知识规则的依从性,使智能交互系统不仅能够在常规场景下准确响应,还能在复杂、多变的业务环境中保持合规性和高服务质量。
自我优化训练(SRT)机制通过自动筛选线上服务日志中的高质量服务案例,选取优秀表现作为正样本补充训练集,从而提升模型在真实业务场景下的服务能力。对于实际业务中表现不佳的负样本,SRT能够自动进行归因分析,并对原始对话进行重写,生成偏好对比数据,用于训练模型识别并规避低质量输出,推动模型持续进化。依托线上服务日志体系,SRT实现对对话数据的自动采集、筛选和评估,构建自我进化的数据闭环,通过不断迭代优化训练集,持续提升智能交互模型的服务能力和用户体验。