手抄报 安全手抄报 手抄报内容 手抄报图片 英语手抄报 清明节手抄报 节约用水手抄报

HQL中分层抽样的办法

时间:2024-10-13 00:21:39

1、如果经常写SQL建议安装sublime text,非常好用的一个编辑工具,打开后选择SQL能够自动对编写内容进行结构化展现

HQL中分层抽样的办法

2、分层抽样的基本原理就是给每个分类编个序号,再从坡庥汩赴每个分类中等间距抽取,从而保证抽样比例与整体一致,举个简单例子,一个数据库shop中字段fruit包含10个apple,5个orange并用id编号,如何保证每次抽到2个apple,1个orange,下面我们用row_number_by_sort、cluster by 语法解决该问题,首先将目标群选出并增加一列新编号

HQL中分层抽样的办法

3、如此新建表后,apple会被排序成1-10,orange会被排序成1-5,接下来只要保证等距离抽取即可,用n%=x即可决定比例

© 手抄报圈