我们如何使用HANA文本分析中的"语言检测"参数检测字符串的语言?

2020-09-22 01:04发布

         点击此处--->   EasySAP.com群内免费提供SAP练习系统(在群公告中)

加入QQ群:457200227(SAP S4 HANA技术交流) 群内免费提供SAP练习系统(在群公告中)


我尝试在"文本分析"中使用"语言检测"参数来检测字符串的语言。 但是它无法正确检测语言。 说,当我尝试中文时,即使HANA支持中文,它也被视为日语。

您能建议一种更好的方法来导出表中文档的语言吗?

在LANG_TEST(DOCUMENT)上创建全文索引LANG_TEST_INDEX_TA_DOC2
 配置" EXTRACTION_CORE_VOICEOFCUSTOMER"
 语言检测(" EN"," DE"," JA"," ZF"," ZH")
 文本分析;
 

感谢和问候

Srujan Gannamaneni

         点击此处--->   EasySAP.com群内免费提供SAP练习系统(在群公告中)

加入QQ群:457200227(SAP S4 HANA技术交流) 群内免费提供SAP练习系统(在群公告中)


我尝试在"文本分析"中使用"语言检测"参数来检测字符串的语言。 但是它无法正确检测语言。 说,当我尝试中文时,即使HANA支持中文,它也被视为日语。

您能建议一种更好的方法来导出表中文档的语言吗?

在LANG_TEST(DOCUMENT)上创建全文索引LANG_TEST_INDEX_TA_DOC2
 配置" EXTRACTION_CORE_VOICEOFCUSTOMER"
 语言检测(" EN"," DE"," JA"," ZF"," ZH")
 文本分析;
 

感谢和问候

Srujan Gannamaneni

付费偷看设置
发送
2条回答
hongfeng1314
1楼-- · 2020-09-22 01:40

您可能想添加导致错误识别的示例文本。 最好是提供一个完整的测试用例,包括表结构,数据和您的查询。

haha101010
2楼-- · 2020-09-22 01:50

Hi Lars,

请在下面找到步骤和相应的输出。

创建COLUMN表lang_test
 (
 id整数主键,
 文档nvarchar(1000)
 );

 在LANG_TEST(DOCUMENT)上创建全文索引LANG_TEST_INDEX_TA_DOC2
 配置" EXTRACTION_CORE_VOICEOFCUSTOMER"
 语言检测(" EN"," ZF"," ZH"," JA")
 文本分析;

  -  - 英语 -  - 
 插入lang_test
 (证件,文件)
 价值
 (1,'我在说英语');

 ---印地语---不支持
 插入lang_test2
 (证件,文件)
 价值
 (2,'मैंहिंदीहरहाहूँ');

  -  - 德语 -  - 
 插入lang_test2
 (证件,文件)
 价值
 (3," Ich spreche Deutsch");

  - -日本 - -
 插入lang_test2
 (证件,文件)
 价值
 (4,'私は日本语を话している');

 ----韩语-
 插入lang_test2
 (证件,文件)
 价值
 (5,'나는한국어로말하고있다。');

 -----简体中文---
 插入lang_test2
 (证件,文件)
 价值
 (6,'我在说简体中文');

  -  - 繁体中文 -  - 
 插入lang_test2
 (证件,文件)
 价值
 (7,'我说的是繁体中文');

 从" $ TA_LANG_TEST_INDEX_TA_DOC2"中选择* 

除了首先传递给"语言检测"参数的语言之外,它无法识别其他任何语言。
所以我只选择了一种语言,说日语

它显示印地文和中文为日语。

如果我错过了任何内容,请提出建议。

感谢和问候

Srujan Gannamaneni

一周热门 更多>