通讯员:李莉洁、殷煜娟
2025年9月25日中午,色情导航 富国商科双周学术论坛(第二十二期)在色情导航 A501-2教室成功举办。
本次论坛以“MEMF: Multi-entity multimodal fusion framework for sales prediction in live streaming commerce”为核心议题,信息资源管理系许光老师为大家分享了直播电商多实体多模态融合框架对销售预测的作用,引发热烈讨论。
直播电商的快速发展带来了丰富的多模态信息,包括文本、图片、数值、视频和音频等,这些信息主要围绕主播、商品和直播间三个核心实体展开。多实体多模态信息在提升销售预测效果方面具有重要价值,但现有研究仍多集中于数值和文本数据,对多模态信息的潜力挖掘不足,同时在融合策略的有效性上也存在局限。
针对这一问题,许光老师团队提出了多实体多模态融合框架(MEMF)。该框架在传统多模态融合的基础上引入实体级融合,从主播、商品和直播间三个核心实体出发,兼顾不同模态在不同实体下的差异与关联,构建更精准的特征表示。在技术实现上,团队基于Transformer架构进行设计:多模态Transformer整合主播和直播间的文本、图像及数值信息,并对视频和音频进行特征提取;QuadTransformer专门处理商品的多模态信息,既刻画商品内部特征,又捕捉商品间关联;多实体Transformer则在整体层面对各类特征进行融合,形成直播的最终特征表示。最终,通过深度神经网络(DNN)实现销售预测,显著提升了模型的准确性。
实验结果显示,基于淘宝直播的真实数据,MEMF框架在各项指标上均显著优于传统机器学习和深度学习方法。其中,商品和视频信息对销售预测贡献最大,凸显了不同实体信息的差异化价值;同时,QuadTransformer在商品特征融合方面表现突出,而多实体Transformer则在整体特征整合上展现出明显优势。
最后,许光老师总结了研究在方法、管理层面所做出的贡献,以及在理论与实践上的创新。同时,他也指出研究仍存在一定不足,有待在更大规模的数据和更深入的分析机制中加以验证。展望未来,团队计划进一步提升模型的可解释性,以推动相关研究的持续发展。
与会人员就框架的普适性、多模态信息的权重分配、直播商业模式多元性等问题深入交流,针对行业新趋势展开深入讨论和思考,直播模式从计划式转向动态化,主播实时调整内容,小主播也有专业团队支撑。商业模式上,“引流款+利润款”分层模式普及,增加销售预测复杂度。场景多元化,户外直播兴起,美颜技术等也给数据处理带来挑战。认为该研究为直播电商销售预测提供了全新技术路径与实践视角。
下一期双周论坛将由营销系傅宏宇老师带来题为“The Effect of Search Platforms on the Spatial Distribution of Retail Locations”的报告。欢迎各位师生届时参会研讨。