Natural Language Processing NLTK - 用于构建Python程序以处理人类语言数据的领先平台。
模式 - 用于Python编程语言的Web挖掘模块。它具有自然语言处理,机器学习等工具。
Quepy - 一个python框架,用于将自然语言问题转换为数据库查询语言中的查询 https://github.com/machinalis/quepy TextBlob - 提供一致的API,用于潜入到常见的自然语言处理(NLP)任务。站在NLTK和模式的巨型肩膀上,并与两者发挥得很好。 textblob.readthedocs.io/en/dev/ YAlign - 一个句子对齐器,开奖,一个友好的工具,atv,用于从可比语料库提取并行句子。 https://github.com/machinalis/yalign jieba - 中文字分割工具。 https://github.com/fxsjy/jieba#jieba-1 SnowNLP - 用于处理中文文本的库。 https://github.com/isnowfy/snownlp spammy - 用于电子邮件垃圾邮件过滤的库,构建于nltk之上 https://github.com/prodicus/spammy loso - 另一个中文分段库。 https://github.com/victorlin/loso genius - 条件随机场的中文分段基础。 https://github.com/duanhongyi/genius 热门文章推荐 (责任编辑:本港台直播) |