2020-09-08 18:40发布
加入QQ群:457200227(SAP S4 HANA技术交流) 群内免费提供SAP练习系统(在群公告中)
您好,大师
如果有人可以告诉我HANA中模糊搜索评分所使用的基础算法,那将有很大的帮助。 为了对测试数据进行空运行,我需要了解这一点。 我尝试使用TF/IDF,但无法推断和计算评分结果。 另外,我还阅读了《 HANA搜索》开发人员指南和其他文档,但不幸的是找不到任何东西。
此致
Deo
您好Deodutt,谢谢您的回答。 最后,我根据相似度计算模式使用不同的情况和不同的值进行了一些黑盒测试。 这并不理想,但是我想我们别无选择,因为契约中的算法似乎是专有的。 问候Piet
欢迎使用任何类似的类似CalculationModes指针,并且它们在算法上也有所不同。
嗨Deodutt,
我有相同的问题,您能找到答案吗?我还想了解如何准确计算分数以便做出明智的决定。
谢谢
Piet
嗨Piet,
不,我没有收到相同的答案。 我将HANA中的结果与python-levinstein库中存在的实现算法进行了比较,但没有完全匹配。 因此,HANA可能会使用某种专有算法进行模糊搜索。 在HANA之外,可以进行一些调整,但可以使用Jaro或Jaro-Winkler获得相似的结果,但是绝对不能使用完全相同的结果集。
同时,您可以在HANA Search开发人员指南中检查权重,类似的CalculationModes和其他功能,这些功能可能会影响基于您的数据集的评分。
最多设置5个标签!
您好Deodutt,谢谢您的回答。 最后,我根据相似度计算模式使用不同的情况和不同的值进行了一些黑盒测试。 这并不理想,但是我想我们别无选择,因为契约中的算法似乎是专有的。 问候Piet
欢迎使用任何类似的类似CalculationModes指针,并且它们在算法上也有所不同。
此致
Deo
嗨Deodutt,
我有相同的问题,您能找到答案吗?
我还想了解如何准确计算分数以便做出明智的决定。
谢谢
Piet
嗨Piet,
不,我没有收到相同的答案。 我将HANA中的结果与python-levinstein库中存在的实现算法进行了比较,但没有完全匹配。 因此,HANA可能会使用某种专有算法进行模糊搜索。 在HANA之外,可以进行一些调整,但可以使用Jaro或Jaro-Winkler获得相似的结果,但是绝对不能使用完全相同的结果集。
同时,您可以在HANA Search开发人员指南中检查权重,类似的CalculationModes和其他功能,这些功能可能会影响基于您的数据集的评分。
此致
Deo
一周热门 更多>