挑战:在30多个市场推广高级精准营销
赛诺菲是世界制药行业的领导者之一. 在过去的三年里, 真人游戏官方app有帮助 赛诺菲CHC(消费者健康保健)业务部门通过以下渠道销售其非处方药 数字优先策略和使能器在正确的时间以正确的信息到达正确的消费者, 横跨30多个市场.
为其季节性产品类别, 赛诺菲CHC开发了一种基于预测的方法,根据预测的需求高峰调整数字媒体支出. 通过多次试点活动, 全球数字转型团队能够证明这种方法的附加价值 根据地理位置,ROAS乘以2到4.
然而, 发起一项新的运动仍然很耗时数据科学家必须通过一系列的手册, 重复且容易出错的任务, 阻止他们专注于其他创新项目. 为了扩大其创新的ML管道, 赛诺菲数据科学团队定义了他们对用例工业化的需求,并呼吁真人游戏官方app的支持来共同设计和实现一个健壮的解决方案.
解决方案:基于6个关键解决方案的共同设计的工业化进程
“该项目成功的关键在于赛诺菲业务专家和赛诺菲数据科学家与真人游戏官方app团队的密切合作.”
- 艾伯特解放军本书,赛诺菲数据科学团队负责人
简化新季节活动的端到端设置
自动化数据摄取和处理任务
使解决方案更加健壮,以防止错误和手动维护
提高项目的可维护性和可伸缩性
在为期一周的快速审核后,制定出当前流程和技术痛点, 团队基于6个关键解决方案实现了一个面向未来的基础设施:
关注点分离:
在预测模型过程中拥有一个独立的ETL管道可以使其更容易维护和扩展. 这使真人APP官网下载能够实现自动检查,并通过一个监测系统向相关团队发送关于摄入状态的详细报告.
使用 三角洲湖 作为数据的黄金来源:
在DS团队中,获取/维护基础设施可能是一件痛苦的事情, 三角洲湖结合了数据仓库和数据湖解决方案的关键特性, 从而消除了SQL数据库管理的复杂性. 它还具有版本控制功能——这对ML再现性很重要——并将作为数据的唯一真实来源.
将尽可能多的代码打包到Python库中以简化过程:
部分初始代码分散在砖中的几本笔记本中, 使依赖关系和代码可重用性的管理复杂化. 基于笔记本的开发与原型设计相关,但会给ML项目工业化带来挑战. 明确定义了在笔记本上实现的Python库,并且只保留砖作为Compute的入口点,这使得泛化笔记本和组织即将到来的活动变得更容易.
利用Spark和砖:
使用超参数搜索方法训练模型可能是耗时和费力的. 这就是砖的自动扩展基础设施和带有Spark和HyperOpt的托管ML运行时派上用场的地方. 在一组工作人员中以分布式的方式使用内存计算可以加快性能,并大大提高训练时间.
使用ML流量跟踪:
与 毫升流跟踪 在适当的位置, 赛诺菲现在拥有一个用户界面,数据科学家可以在此比较模型运行,并跟踪使用的所有参数(数据版本和模型参数)和获得的结果.
简化了新的ML模型的测试和实现:
建立了通用的模型工厂框架, 使新的机器学习模型更容易实现, 并在精准营销活动中尝试它们.
结果和学习:设置时间除以4,用于数据摄取和配置
感谢这个项目, 赛诺菲CHC能够大大简化其数据管道,并加速其基于预测的精准营销用例的扩展.
减少新战役的准备时间:
- 数据摄取和配置的设置时间减少了四分之一.
- 数据科学家开展新活动所执行的任务数量减少了三分之一.
简化新的预测模型的创建:
- 可访问的平台,方便地测试,管理和可视化模型.
- 包含新数据源的一般流程.
- 自动数据管道.
该项目还让团队为未来的ml驱动项目获得了4个重要的经验教训:
在ML项目中整合数据工程:
从项目开始就加入数据工程师,以加速管道的工业化, 并清楚地解耦管道的不同阶段(所有数据处理, 在进入ML阶段之前必须进行转化和管理).
利用预先打包好的工具:
三角洲湖和ML Flow的砖的使用对工业化的成功至关重要, 确保一个简单的自助服务基础设施,而不需要DevOps.
业务和数据团队之间的深度协作:
可能最重要的成功因素是赛诺菲商业专家和数据科学家之间的密切合作, 是谁构思并推动了这个项目, 与工件团队合作, 谁带来了额外的工业化经验和技术.
使用敏捷方法实现工业化:
敏捷方法(冲刺,快速迭代和反馈 & 在确定和解决赛诺菲的所有痛点和确保为赛诺菲团队提供价值方面非常有效.
神器要感谢柳泽绫, 艾伯特解放军本书, 安东尼Tran-Quan-Nam, 感谢赛诺菲的Laurent Gautier和Sergio Villordo在这个项目上的信任和合作, 以及砖团队的反馈支持. 本文由赛诺菲CHC和砖团队与Tristan Silhol共同撰写, 毛伊岛酒吧, 来自真人游戏官方app美国和法国办公室的Louise Morin和Eva Le Saux.