博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
利用HanLP计算中文词语语义相似度
阅读量:6162 次
发布时间:2019-06-21

本文共 898 字,大约阅读时间需要 2 分钟。

HanLP官方GitHub地址

HanLP

在java项目中配置HanLP

推荐使用Maven方法
在poem.xml中加入以下代码

<dependency>

<groupId>com.hankcs</groupId>
<artifactId>hanlp</artifactId>
<version>portable-1.3.3</version>
</dependency>
但是在AndroidStudio中,没有Maven,所以在build.gradle的dependencies中加入如下代码

compile "com.hankcs:hanlp:portable-1.3.3"

还可以下载jar包和data包,使用hanlp.properties进行手动配置
在 IntelliJ IDEA中进入file -> project structure,在Libraries中添加jar包

更改hanlp.properties中的首行,指向data包所在的位置

将hanlp.properties放在out -> production -> name目录下

调用HanLP

import com.hankcs.hanlp.dictionary.CoreSynonymDictionary;
只需要以上语句便可以使用HanLP

//使用hanlp计算语义距离

double[] numarray = new double[title_list.size()];
for (int i = 0; i < results.size(); i++) {
for (int j = 0; j < title_list.size(); j++) {
numarray[j] += CoreSynonymDictionary.similarity(results.get(i).name().toString(), title_list.get(j).toString());
}
}

文章来源于citySouth的博客

转载于:https://blog.51cto.com/13993767/2312270

你可能感兴趣的文章
HP DL380G4服务器前面板指示灯的含义
查看>>
数据结构_树结构
查看>>
常用URL地址
查看>>
每天一个linux命令(19):find 命令概览
查看>>
MySQL kill操作
查看>>
windows下看端口占用
查看>>
Decommissioning a Domain Controller 降域控
查看>>
Character中的奇葩
查看>>
c++书籍推荐
查看>>
轻松监听Azure service health 状态
查看>>
获取SQL SERVER某个数据库中所有存储过程的参数
查看>>
在Linux下编译安装Apache2(2)
查看>>
Method Swizzling 处理一类简单的崩溃
查看>>
AngularJS学习!
查看>>
在Eclipse中搭建Python Django
查看>>
struts国际化
查看>>
Laravel 5.0 - Middleware (中间件)
查看>>
文件特殊权限及facl
查看>>
我的友情链接
查看>>
Android按两次返回键退出应用
查看>>