关于手机等品牌型号搜索与采集的中文分词分离

网友投稿 732 2022-12-01

关于手机等品牌型号搜索与采集的中文分词分离

关于手机等品牌型号搜索与采集的中文分词分离

很久以前,写过一个手机的搜索查询,这里要涉及到手机类型和型号的分离。

很久之后前,有人问起这个问题,于是,写点说明就把这函数的草稿发布了,并写下了这一些说明。

函数说明,如搜索输入:诺基亚N95,将被拆分成品牌:诺基亚 型号:N95

对于手机数据采集,也可以用这函数分离出品牌和型号。

SetSearchKey("诺基亚N95",out 诺基亚,out N95);

函数代码如下:

protected void SetSearchKey(string keyword, out string goodsName, out string goodsModel) { keyword = keyword.ToLower().Trim(); if (keyword.Contains(" "))//带空格,分离 { goodsName = keyword.Split(' ')[0].Trim(); goodsModel = keyword.Split(' ')[1].Trim(); } else if (Regex.Match(keyword, @"^[\u4E00-\u9FA5]+[\w\d]+").Success)//以中文开头,包含英文,分离 { goodsName = Regex.Match(keyword, @"^([\u4E00-\u9FA5]+)[\w\d]+").Groups[1].Value; goodsModel = keyword.Replace(goodsName, string.Empty); } else { string[] keys = new string[] { "nec", "lg", "vk", "cect" }; for (int i = 0; i < keys.Length; i++) { if (keyword.IndexOf(keys[i]) == 0) { goodsName = keys[i]; goodsModel = goodsModel = keyword.Replace(goodsName, string.Empty); return; } } goodsName = keyword; goodsModel = keyword; } }

版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:说点包租公限制共享上网的破事
下一篇:public virtual T Get(string key, T defaultValue)
相关文章

 发表评论

暂时没有评论,来抢沙发吧~