「拼多多」数据分析岗面试真题,附答案!

1周前 (11-19 00:24)阅读2回复0
丸子
丸子
  • 管理员
  • 注册排名9
  • 经验值50640
  • 级别管理员
  • 主题10128
  • 回复0
楼主

哈喽,小伙伴们~

今天小编各人分享一波儿“大厂面试实题解析”。本篇,讲一讲业界薪资天花板之—— 『拼多多』,以下拼多多面试实题能够自测模仿,曲不雅感触感染下难易水平 (含参考谜底+备考Tips)。

本文目次:

SQL题

机器进修与概率论

开放性问题

SQL题

现有一张用户成交订单表,表名:user_order_summary,字段如下:

uid 用户ID,主键

order_cnt 成交订单数

面试实题1:

请利用 MySQL 计算出成交订单数的寡数。

★解题构想:

起首领会一下寡数的概念。寡数(Mode)是指在统计散布上具有明显集中趋向点的数值,代表数据的一般程度。也是一组数据中呈现次数最多的数值,有时寡数在一组数中有好几个。

情状①:一组数据中,呈现次数最多的数就叫那组数据的寡数。

举例:1,2,3,3,4的寡数是3。

情状② :若是有两个或两个以上个数呈现次数都是最多的,那么那几个数都是那组数据的寡数。

举例:1,2,2,3,3,4的寡数是2和3。

情状③:若是所有数据呈现的次数都一样,那么那组数据没有寡数。

举例:1,2,3,4,5没有寡数。

★参考谜底

SELECTorder_cnt FROM(SELECTorder_cnt ,user_cnt, rankover( orderbyuser_cnt desc) ASrank_id FROM(SELECTorder_cnt , COUNT( 1) ASuser_cnt FROMuser_order_summary GROUPBYorder_cnt )a)aWHEREuser_cnt 1-- 剔除情状3AND rank_id = 1

面试实题2:

请利用 MySQL 计算出成交订单数的四分位数。

★解题构想:

起首领会一下四分数的原理及计算逻辑。四分位数(Quartile)也称四分位点,是指在统计学中把所有数值由小到大摆列并分红四等份,处于三个朋分点位置的数值。它是一组数据排序后处于25%,中位数和75%位置上的值。四分位数是通过3个点将全数数据等分为4部门,此中每部门包罗25%的数据。

展开全文

四分数的位置:

Q1的位置= (n+1) × 0.25

Q2的位置= (n+1) × 0.50

Q3的位置= (n+1) × 0.75

n表达项数,也就是计算样本量

▼ 情状①

数据为:6, 47, 49, 15, 42, 41, 7, 39, 43, 40, 36

由小到大摆列:6, 7, 15, 36, 39, 40, 41, 42, 43, 47, 49

总共11项:

Q1的位置=(11+1)×0.25=3,所以Q1=13

Q2的位置=(11+1)×0.50=6,所以Q2=40

Q3的位置=(11+1)×0.75=9,所以Q2=43

▼ 情状②

数据总量:7, 15, 36, 39, 40, 41

一共6项:

Q1的位置=(6+1)×0.25=1.75,在第1和第2个之间

Q2的位置=(6+1)×0.50=3.50,在第3和第4个之间

Q3的位置=(6+1)×0.75=5.25,在第5和第6个之间

▼ 当Qi的位置并不是整数,若何计算呢?

第一步:将数据从小到大排序,计为数组a,a[i]表达第i个位置的数值

第二步:确认四分位数的位置P,将P的整数部门计为c,小数部门记为d,好比Q1的位置为1.75,那么c=1,d=0.75

第三步:计算位置P对应的值,a[p] = a[c]+(a[c+1]-a[c])*d,好比Q1的位置1.75计算成果为a[1.75]=a[1]+(a[1+1]-a[1])*0.75=7+(15-7)*0.75=13

以此类推,能够计算得到:

a[Q1]=a[1.75]=a[1]+(a[2]-a[1])*0.75=13

a[Q2]=a[3.5]=a[3]+(a[4]-a[3])*0.5=37.5

a[Q3]=a[5.25]=a[5]+(a[6]-a[5])*0.25=40.25

★参考谜底

Tips:

无论是社招仍是校招,笔试仍是面试,拼多多均会重点察看SQL题,且比拟其他大厂,拼多多对SQL的要求较高。所以,请务必娴熟娴熟再娴熟!

机器进修概率论

面试实题1:模子过拟合怎么处置?

★参考谜底

模子过拟合次要能够从以下几个方面动手:

获取更大都据,扩大数据量。

降低模子复杂度。

添加正则项。

改为集成进修。

面试实题2:请介绍一下SVM原理。

★参考谜底

SVM是一种二类分类模子。它的根本模子是在特征空间中寻找间隔更大化的别离超平面的线性分类器。(间隔更大是它有别于感知机)

情状①:当训练样本线性可分时,通过硬间隔更大化,进修一个线性分类器,即线性可分撑持向量机;

情状②:当训练数据近似线性可分时,引入败坏变量,通过软间隔更大化,进修一个线性分类器,即线性撑持向量机;

情状③:当训练数据线性不成分时,通过利用核技巧及软间隔更大化,进修非线性撑持向量机。

Tips:

那类问题碰着一些偏手艺向面试官,会揪着细节不竭提问,以来察看你的根本功能否扎实,所以还需要对原理停止详细的理解和推导。

下面填补两个SVM的衍生问题,供各人参考:

问题①:SVM为什么接纳间隔更大化?

★参考谜底

当训练数据线性可分时,存在无限个别离超平面能够将两类数据准确分隔。感知机操纵误分类最小战略,求得别离超平面,不外此时的解有无限多个。线性可分撑持向量机操纵间隔更大化求得更优别离超平面,那时,解是独一的。另一方面,此时的分隔超平面所产生的分类成果是最鲁棒的,对未知实例的泛化才能最强。

问题②:为什么SVM要引入核函数?

★参考谜底

当样本在原始空间线性不成分时,可将样本从原始空间映射到一个更高维的特征空间,使得样本在那个特征空间内线性可分。

开放性问题

面试实题1:假设拼多多近期GMV下滑严峻,请问若何阐发?

★参考构想

1、问题确认

起首,需要确认该问题能否实在存在,即校验数据的准确性。

例如:数据提取能否存在逻辑错误,上游表能否存在反复笔录的问题?

2、确认有无外因,举例

情况影响:能否存在外界因素,好比受疫情影响,快递公司无法一般配送。招致线上无法成交。

时间因素:能否存在季节性的颠簸,好比双十一大促属于用户成交顶峰期,而非双十一大促成交相对较少。

竞品因素:好比竞品淘特/抖音等上线大型补助活动,势必会对拼多多产生较大的冲击。

3、内因阐发拆解,供给一种构想,详细各人能够拓展发扬举例

货-商品维度拆解:例如可设想相关目标(如:奉献度)定位异常行业、店铺等

人-用户维度拆解:例如可根据用户的属性,好比地区,年龄,新老客,价值品级等维度停止拆合成析

场-场景维度拆解:例如可根据大盘常见场景有无做功用变更、战略迭代等停止拆解确认等等

面试实题2:怎么预算上海外卖员的数量?

★参考谜底

▶ 目标拆解

外卖员的数量 = 每天订单总数 / 每人每天可配送的订单数

每天订单总数 = 目的用户数 / 点单频度

目的用户数 = 上海市总人数*点外卖人数占比

目的用户数 = 上海市总人数*点外卖人数占比

每人每天可配送的订单数 = 每天工做时间 / 完成一个订单需要的时间

完成一个订单需要的时间 = 商家间隔/骑手速度+列队期待时间+目标地间隔/骑手速度 + 用户期待时间

完成一个订单需要的时间 = 商家间隔/骑手速度+列队期待时间+目标地间隔/骑手速度 + 用户期待时间

▶ 已知及假设

上海市总人数:2500w

点外卖人数占比:假设为40%

骑手每天工做时间:10H

商家间隔:假设为3KM

骑手速度:25KM/h

列队期待时间:0.25H

目标地间隔:4KM

用户期待时间:0H

▶ 计算可得

每天的总订单数 = 200w

每人每天可配送的订单数 = 18.9单

外卖员的数量=10.5万人

Tips:

预算类问题重点察看解题构想。

来 源:数据攻略/做 者:六哥

来 源:数据攻略/做 者:六哥

以上就是拼多多面试实题解析参考,更多大厂面试实题,小编已经打包好了, 人手一份,速领!

简历概览

面试题概览

面经概览

0
回帖

「拼多多」数据分析岗面试真题,附答案! 期待您的回复!

取消
载入表情清单……
载入颜色清单……
插入网络图片

取消确定

图片上传中
编辑器信息
提示信息