我可以为下面的输入数据获得一个聚类聚类的解决方案

2020-09-28 11:52发布

         点击此处--->   EasySAP.com群内免费提供SAP练习系统(在群公告中)

加入QQ群:457200227(SAP S4 HANA技术交流) 群内免费提供SAP练习系统(在群公告中)


我想找到一种基于分数对下表进行聚类的解决方案,例如,属于分数0,0.1范围的数据集应归为一个聚类。

客户ID 1客户ID2Score35356457647647654654746.1346265445674574740.15464565445645650.2647567886546546450.36786786786766767897890.30.3455455454654640.534346356356546560.635345345367567678678678345455674678679789780.85578689934756786780

我得到了他下面的代码,该数据来自SCN网络的示例数据,用于使用聚集聚类,但是我不确定数据参数表的参数值是什么。

DROP TABLE DATA_TBL;

像DATA_T一样创建列表DATA_TBL;

插入DATA_TBL值('0',0.5,0.5,'A');

插入DATA_TBL值('1',1.5、0.5,'B');

插入DATA_TBL值('2',1.5,1.5,'B');

插入DATA_TBL值('3',0.5,1.5,'B');

插入DATA_TBL值('4',1.1,1.2,'B');

插入DATA_TBL值('5',0.5,15.5,'B');

插入DATA_TBL值('6',1.5、15.5,'C');

插入DATA_TBL值('7',1.5、16.5,'C');

插入DATA_TBL值('8',0.5,16.5,'C');

插入DATA_TBL值('9',1.2、16.1,'C');

插入DATA_TBL值('10',15.5、15.5,'C');

插入DATA_TBL值('11',16.5,15.5,'D');

插入DATA_TBL值('12',16.5,16.5,'D');

插入DATA_TBL值('13',15.5、16.5,'D');

插入DATA_TBL值('14',15.6,16.2,'D');

插入DATA_TBL值('15',15.5、0.5,'D');

插入DATA_TBL值('16',16.5,0.5,'A');

插入DATA_TBL值('17',16.5,1.5,'A');

插入DATA_TBL值('18',15.5、1.5,'A');

插入DATA_TBL值('19',15.7,1.6,'A');

DROP TABLE PARAMETERS_TBL;

像创建PARAMETERS_T一样创建列表PARAMETERS_TBL;

INSERT INTO PARAMETERS_TBL VALUES('THREAD_NUM',8,null,null);

INSERT INTO PARAMETERS_TBL VALUES('CLUSTER_NUM',4,null,null);

INSERT INTO PARAMETERS_TBL VALUES('CLUSTER_METHOD',4,null,null);

INSERT INTO PARAMETERS_TBL VALUES('DISTANCE_FUNC',10,null,null);

INSERT INTO PARAMETERS_TBL VALUES('DISTANCE_DIMENSION',null,3,null);

INSERT INTO PARAMETERS_TBL VALUES('NORMALIZWEIGHTS',null,0.1,null);

INSERT INTO PARAMETERS_TBL VALUES('CATEGORY_COL',3,null,null);

E_TYPE',0,null,null);

请让我知道如何使用输入表来实现这一点。

         点击此处--->   EasySAP.com群内免费提供SAP练习系统(在群公告中)

加入QQ群:457200227(SAP S4 HANA技术交流) 群内免费提供SAP练习系统(在群公告中)


我想找到一种基于分数对下表进行聚类的解决方案,例如,属于分数0,0.1范围的数据集应归为一个聚类。

客户ID 1客户ID2Score35356457647647654654746.1346265445674574740.15464565445645650.2647567886546546450.36786786786766767897890.30.3455455454654640.534346356356546560.635345345367567678678678345455674678679789780.85578689934756786780

我得到了他下面的代码,该数据来自SCN网络的示例数据,用于使用聚集聚类,但是我不确定数据参数表的参数值是什么。

DROP TABLE DATA_TBL;

像DATA_T一样创建列表DATA_TBL;

插入DATA_TBL值('0',0.5,0.5,'A');

插入DATA_TBL值('1',1.5、0.5,'B');

插入DATA_TBL值('2',1.5,1.5,'B');

插入DATA_TBL值('3',0.5,1.5,'B');

插入DATA_TBL值('4',1.1,1.2,'B');

插入DATA_TBL值('5',0.5,15.5,'B');

插入DATA_TBL值('6',1.5、15.5,'C');

插入DATA_TBL值('7',1.5、16.5,'C');

插入DATA_TBL值('8',0.5,16.5,'C');

插入DATA_TBL值('9',1.2、16.1,'C');

插入DATA_TBL值('10',15.5、15.5,'C');

插入DATA_TBL值('11',16.5,15.5,'D');

插入DATA_TBL值('12',16.5,16.5,'D');

插入DATA_TBL值('13',15.5、16.5,'D');

插入DATA_TBL值('14',15.6,16.2,'D');

插入DATA_TBL值('15',15.5、0.5,'D');

插入DATA_TBL值('16',16.5,0.5,'A');

插入DATA_TBL值('17',16.5,1.5,'A');

插入DATA_TBL值('18',15.5、1.5,'A');

插入DATA_TBL值('19',15.7,1.6,'A');

DROP TABLE PARAMETERS_TBL;

像创建PARAMETERS_T一样创建列表PARAMETERS_TBL;

INSERT INTO PARAMETERS_TBL VALUES('THREAD_NUM',8,null,null);

INSERT INTO PARAMETERS_TBL VALUES('CLUSTER_NUM',4,null,null);

INSERT INTO PARAMETERS_TBL VALUES('CLUSTER_METHOD',4,null,null);

INSERT INTO PARAMETERS_TBL VALUES('DISTANCE_FUNC',10,null,null);

INSERT INTO PARAMETERS_TBL VALUES('DISTANCE_DIMENSION',null,3,null);

INSERT INTO PARAMETERS_TBL VALUES('NORMALIZWEIGHTS',null,0.1,null);

INSERT INTO PARAMETERS_TBL VALUES('CATEGORY_COL',3,null,null);

E_TYPE',0,null,null);

请让我知道如何使用输入表来实现这一点。

付费偷看设置
发送
2条回答
wang628962
1楼-- · 2020-09-28 12:41

input-datatable.txt 由于以前共享的表,无法基于SCORES列附加要聚类的输入数据表

Nan4612
2楼-- · 2020-09-28 12:52

这个问题看起来像_,它指的是SAP HANA PAL函数,但缺少很多上下文。

请更详细地描述您使用的软件(版本)以及您实际想要实现的功能,即您想通过使用"聚集集群"回答的业务问题是什么?

一周热门 更多>