自然语言处理
发布者:admin 发表于:446天前 阅读数:766 评论:0

自然语言处理

用于使用人类语言的图书馆。

getlang - 快速自然语言检测程序包。

go-i18n - 用于处理本地化文本的软件包和一个随附工具。

go-mystem - CGo与Yandex.Mystem的绑定-俄罗斯形态分析仪。

go-nlp - 用于处理离散概率分布的实用程序和其他可用于执行NLP工作的工具。

go-pinyin - CN Hanzi至Hanyu拼音转换器。

go-stem - 搬运程序阻止算法的实现。

go-unidecode - Unicode文本的ASCII音译。

go2vec - 用于word2vec嵌入的阅读器和实用程序功能。

gojieba - 这是一个围棋实施解霸其中中国分词算法。

golibstemmer - 雪球库libstemmer库的绑定,包括porter 2。

gotokenizer - 基于字典和Goram语言的Bigram语言模型的标记器。(现在仅支持中文细分)

gounidecode - Go的Unicode音译器(也称为unidecode)。

gse - 进行有效的文本分割;支持英语,中文,日语等。

icu - CGO结合为ICU4C C库检测和转换功能。保证与版本50.1兼容。

kagome - 用纯Go语言编写的JP形态分析仪。

libtextcat - libtextcat C库的Cgo绑定。保证与2.2版兼容。

MMSEGO - 这是MMSEG的GO实现,它是中文分词算法。

nlp - 从字符串中提取值,并用nlp填充您的结构。

nlp - 支持LSA(潜在语义分析)的自然语言处理库。

paicehusk - Paice / Husk提取算法的Golang实现。

petrovich - 彼得罗维奇(Petrovich)是图书馆,在给定的语法情况下使用俄语名称。

porter - 这是Martin Porter的Porter干算法的C实现的相当简单的移植。

porter2 - 非常快的Porter 2 提取器。

prose - 用于文本处理的库,支持标记化,词性标记,命名实体提取等。仅限英语。

RAKE.go - 快速自动关键字提取算法(RAKE)的Go端口。

segment - 用于执行Unicode标准附件#29中所述的Unicode文本分段的Go库

sentences - 句子标记器:将文本转换为句子列表。

shamoji - shamoji是用Go编写的单词过滤程序包。

snowball - Go的雪球茎端口(cgo包装器)。提供单词词干提取功能Snowball本机。

stemmer - 用于Go编程语言的Stemmer软件包。包括英语和德语词干。

textcat -Go软件包,用于基于n-gram的文本分类,并支持utf-8和原始文本。

whatlanggo - Go的自然语言检测程序包。支持84种语言和24种脚本(书写系统,例如拉丁语,西里尔字母等)。

when - 自然EN和RU语言日期/时间分析器具有可插拔的规则。