《信息化项目运维研讨PPT系列》:2.王栋--机器学习在美团:吃喝玩乐中的计算

收藏

编号:20190715103948488121    类型:共享资源    大小:11.59MB    格式:PDF    上传时间:2019-07-15
  
0
积分
关 键 词:
信息化项目运维研讨PPT系列 信息化 项目 研讨 PPT 系列
资源描述:
机器学习!美团“ ——吃喝玩乐中的算法问题“ wangdong07@meituan.com 背景 # $%$行业及美团简介 算法应用 # 机器学习在用户端的应用 # 机器学习在商户端的应用 总结 # 算法应用八大“坑” O2O ““““$%$““$%$移动应用行业报告 O2O 来源:45(6)’785+5及品途网 %9:;“$%$移动应用行业报告 团购 外卖 打车 电影票 频度 渗透率 门票 酒店 机票 租房 挂号 美业 家政 拼车 什么样的领域有机会? vs. 用户获取成本 用户价值 买房 刷牙 微信 !““#$%99“ H99“ I99“ :999“ :%99“ :;99“ %9:9“ %9::“ %9:%“ %9:J“ %9:;“ %9:K*“ 美团网交易额(亿元) %9:;年1%月:美团网拥有:亿多活跃移动用户, 移动端贡献L99M的交易额 9“ :9“ %9“ J9“ ;9“ K9“ H9“ N9“ I9“ %9::“ %9:%“ %9:J“ %9:;“ 美团移动交易占比 999M“ :999M“ %999M“ J999M“ ;999M“ K999M“ H999M“ 9OA“ JOA“ HOA“ POA“ :%OA“ :KOA“ :IOA“ %:OA“ G5QR:“ G5QRJSJK“ G5QRKS:9“ 电影 酒店 美发T美容T美体 美食 摄影写真 生活服务 休闲娱乐 运动健身 所有品类 9“ K99“ :999“ :K99“ %999“ %K99“ J999“ JK99“ ;999“ ;K99“ 北 京 广 州 天 津 福 州 杭 州 无 锡 合 肥 成 都 美容美发 休闲娱乐 生活服务 运动健身 摄影写真 电影 酒店 美食 80% O2O 平台“ • 获取用户T商户“ • 匹配供给需求“ “ 用户“ • 个性化“ • 场景化“ • 即时化“ 商户“ • 动态触达用户“ • 提供丰富产品“ 传统模型:边际收益递减“ 平台模型:双边市场的网络效应/》边际收益递增 /》平台价值“ 吸引访 问T再访 # 自然流量 # 站外广告 # 主动推送 促成购 买 # 信息聚合 # 用户行为引导 # 运营拉新 提升多 次访购 # 搜索、浏览主动 引导 # 个性化推荐 # 跨品类转新 商机发现 # 销售拜访 路线优化 商家入住 及上单 # 预测可能入住商户 # 自动写单提高上单效率 运营 # 风控防刷单 # 销量预估 背景 # $%$及美团介绍 算法应用 # 机器学习在用户端的应用 # 机器学习在商户端的应用 总结 # 算法应用八大“坑” • 运营拉新“ • 推送引导 • 流量转化“ • 销量预估 • 电影票房预估“ • UU“ 平台“ • 获取用户T商户“ • 匹配供给需求“ “ 用户“ • 个性化“ • 场景化“ • 即时化“ 商户“ • 动态触达用户“ • 提供丰富产品“ 背景:首购SL留存,吸引已注册用户完成首购“ 目标:少花钱,多办事 方法:新用户画像 2VB分类“ • 准确率:NKM“ • 召回率:HIM“ 效果“ • 拉新单位成本下降JKM“ 单位用户营销成本/总花销T总新客数 “ • 总开支节省J9M“ 选择对象 # 选择准 则优化 发出消息 # 目标:发出率 # 固定时间拉取改 为灵活推送 # 发送时机优化, 考虑用户的历史 联网时间,当前 位置 打开消息 # 目标:打 开率 # 动态文案 M 搜索 浏览 推荐 意图 强度 流量 规模 用户偏好# 场景# 位置# 快速交互# 应 用 层 模 型 层 触 发 层 数 据 层 排 序 层 搜索推荐平台 准 入 层 Flume Agent Impression Log Labeled Data Order/Click Log Deal DB Control Service Model 1 Model 2 … API Online train feature Offline train feature monitor 应 用 层 模 型 层 特 征 归 一 化 特 征 选 择 WO)“=XY5A*G“ BY+Y5(“Z’[,A\5E,’ spark 历史查询词 查询补全 结果页 数据获取时效性 清洗提高准确性 架构支撑“ 基础数据获取“ 查询引导 同义词挖掘 团单品类映射 查询分析“ 系统架构调整 增加吞吐量 改进协议 重排序“ 特征工程 LR + GBDT 融合效果 实时化“ 实时品类偏好 实时下单位置 模型在线更新 ! • • ! ! ! 数据清洗 在线获取训练 所需特征 冷启动“ 数据及特征工程“ 使用位置信息 引入排序模型 粗排序“ 新单推荐 使用位置信息 重排序“ Additive groves 使用位置 分品类细化 实时化“ 实时品类偏好 实时下单位置 实时特征更新 2+,34)/1特征# # 当前距离“ # 历史距离“ # 最近点击T下单T支付“ # 历史点击T下单T支付“ -/9H9P“ %9:;9H:9“ %9:;9H::“ %9:;9H:%“ %9:;9H:J“ %9:;9H:;“ %9:;9H:K“ %9:;9H:H“ %9:;9H:N“ %9:;9H:I“ %9:;9H:P“ %9:;9H%9“ %9:;9H%:“ %9:;9H%%“ %9:;9H%J“ %9:;9H%;“ %9:;9H%K“ %9:;9H%H“ %9:;9H%N“ %9:;9H%I“ %9:;9H%P“ %9:;9HJ9“ F5=*()’*“ O,+c[,Ac(,D5(“ 下单率 搜索 浏览 推荐 意图 强度 流量 规模 统一框架,快速迭代,经验共享 “ “ “ “ 训练数据规模小“ 挖掘可扩展的特征“ 采用非线性、鲁棒模型“ 标注标准复杂主 观“ 复杂目标进行模型分解“ 交叉验证减少噪音“ 单用户特征不可 用“ 人机结合提取稳定因素“ 使用用户统计特征“ 多团队合作 协调各方预期和利益“ 背景:在线G*5(数量众多,需要关注G*5(的质量“ 目标:评估G*5(的质量 方法:“ 分解问题“ • 以销售额来代表质量“ • 再分解销售额“ 根据问题特征T模型并迭代“ OabRTT+*DO\*)+Y5’D,\T\+S\()’5DE,’SO,dS+,S\(O+\( 效果:“ : 访购率预测准确率(]%)R“9I“ % 价格特征权重符合产品预期“ 挑战:“ 东西方人情世故不同“ 演员T导演的名气不靠谱“ 度量搜索T社交媒体效果不理想“ “ 背景:电影票房预测数据可以“ “ 指导片方发行T院线排片“ 目标:得到可用票房预测 机遇:“ 猫眼J9M3市占的数据“ 用户其他行为及消费记录 “ 背景 # $%$及美团介绍 算法应用 # 机器学习在用户端的应用 # 机器学习在商户端的应用 总结 # 算法应用八大“坑” “ ” 确实需要上算法么?“ “ “ “ 算法一定要酷炫“ 算法准确率不到P9M就是耍流氓?“ / ) 上线就是大功告成“ AB 统计分析实时化“ “美团技术沙龙“ 筹办中,敬请关注“ “ 标题请注明 机器学习算法T架构工程师, 简历投递地址 相关问题探讨及咨询,“ 个人微信号:Gd5’7PN
展开阅读全文
  赶蛙网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
关于本文
本文标题:《信息化项目运维研讨PPT系列》:2.王栋--机器学习在美团:吃喝玩乐中的计算
链接地址:http://www.gwye.com/p-135699.html

copyright@ 2018-2028 赶蛙网版权所有
 ICP备案编号:蜀ICP备19008733号-2

1
收起
展开