
资料子集,数据子集
Whether a test data subset with optional privacy masking should be created.
是否创建带有可选屏蔽的测试数据子集。
Start table: This field contains the key table that is used as a basis to select the data subset.
Start table:这个字段包含关键的表,该表是选择数据子集的基础。
When using Optim TDM to create the test data subset, there is no application-enforced limit on the number of rows that can be copied.
当使用Optim TDM创建测试数据子集时,应用程序对可以复制的行没有限制。
The solution is to recognize what data subset the anomaly detector looks for and make sure that subset is accurately represented in the simulation, he says.
这个解决方案是认识异常探测器寻找什么数据子集并且保证在模拟中准确地表现这个子集。
"Data+subset"是计算机科学与统计学中常见的组合概念,指从原始数据集中按照特定规则提取的部分数据集合。以下从三个层面进行解释:
"data subset"(数据子集)指从完整数据集中提取出的部分数据,通常用于特定分析或任务。以下是详细解释:
基本定义 数据子集是原始数据集的组成部分,通过筛选、抽样或分割获得。例如从100万条用户数据中随机抽取10%作为分析样本。
核心用途
典型应用场景:当处理TB级数据时,先用子集进行算法原型开发,验证有效后再用全集训练模型,可节省90%以上的初期计算资源。
【别人正在浏览】