首页 供应 求购 产品 公司 登陆

大数据中文分词:NLPIR大数据挖掘系统

  • 发布时间:2016-09-21 15:04:50
    报价:面议
    地址:北京,海淀,北京市海淀区苏州街49-3号盈智大厦5层(总部)
    公司:灵玖中科软件(北京)有限公司
    手机:15801695527
    微信:bigdatasaas
    电话:010-62648216
    用户等级:普通会员 已认证

     词法分析是自然语言处理的基础与关键。灵玖软件在多年研究工作积累的基础上,研制出了NLPIR分词挖掘系统,主要功能包括中文分词;英文分词;词性标注;命名实体识别;新词识别;关键词提取;支持用户专业词典与微博分析。

    NLPIR文本搜索与挖掘开发平台针对互联网内容处理的需要,融合了自然语言理解、网络搜索和文本挖掘的技术,提供了用于技术二次开发的基础工具集。开发平台由多个中间件组成,各个中间件API可以无缝地融合到客户的各类复杂应用系统之中,可支持多种编码(GBK编码、UTF8编码、BIG5编码)、多种操作系统(Windows, Linux, FreeBSD等所有主流操作系统)、多种开发语言与平台。

    NLPIR是一套专门针对原始文本集进行处理和加工的软件,提供了中间件处理效果的可视化展示,也可以作为小规模数据的处理加工工具。用户可以使用该软件对自己的数据进行处理。

    NLPIR分词挖掘系统主要功能介绍

    1)中英文混合分词功能

    自动对中文英文信息进行分词与词性标注功能,涵盖了中文分词、英文分词、词性标注、未登录词识别与用户词典等功能;

    2)关键词提取功能

    采用交叉信息熵的算法自动计算关键词,包括新词与已知词;

    3)新词识别与自适应分词功能

    从较长的文本内容中,基于信息交叉熵自动发现新特征语言,并自适应测试语料的语言概率分布模型,实现自适应分词。

    4)用户专业词典功能

    可以单条导入用户词典,也可以批量导入用户词典。如可以定“举报信 敏感点”,其中举报信是用户词,敏感点是用户自定义的词性标记。

    5)微博分词功能

    对博主ID进行nr标示,对转发的会话进行自动分割标示(标示为ssession),URL以及Email进行自动标引。

    提醒:联系时请说明是从志趣网看到的。

免责申明:志趣网所展示的信息由用户自行提供,其真实性、合法性、准确性由信息发布人负责。使用本网站的所有用户须接受并遵守法律法规。志趣网不提供任何保证,并不承担任何法律责任。 志趣网建议您交易小心谨慎。

关于我们 | 联系我们 | 免责声明 |@2025 bestb2b.com

©志趣网