首页 供应 求购 产品 公司 登陆

灵玖LJParser智能网络信息挖掘系统

  • 发布时间:2017-01-19 17:55:42
    报价:面议
    地址:北京,海淀,北京市海淀区苏州街49-3号盈智大厦5层(总部)
    公司:灵玖中科软件(北京)有限公司
    手机:15801695527
    微信:bigdatasaas
    电话:010-62648216
    用户等级:普通会员 已认证

      伴随着互联网的普及,尤其的移动互联网的快速发展,网络技术和云计算被普遍应用,网民的网络使用痕迹能够被分析和处理,从而导致了企业运营体系的变革。但是在国内,企业在大数据运用方面尚处在起步阶段,尤其是在用户行为挖掘、信息、搜索引擎等服务型应用以及这些应用背后的数据分析上,目前国内大部分企业都需要大数据智能挖掘技术。

      而是同类系统软件使用效果比较好的系统软件。是网络搜索、自然语言理解和文本挖掘的技术开发的基础工具集,开发平台由多个中间件组成,各个中间件API可以无缝地融合到客户的各类复杂应用系统之中。具体中间件包括:

      1 汉语词法分析中间件(分词、词性标注、人名地名机构名识别)

      汉语词法分析中间件能对汉语语言进行拆分处理,是中文信息处理必备的核心部件。灵玖综合了各家所长,采用条件随机场(Conditional Random Field,简称CRF)模型,分词准确率接近99%,具备准确率高、速度快、可适应性强等优势;特色功能包括:切分粒度可调整,融合20余部行业专有词典,支持用户自定义词典等。

      2新语自动发现中间件

      新词自动发现技术能够识别出词典中没有出现过的词汇、短语、命名实体、流行用语,是语言文献分析方面的一把利器。新词发现脱胎于语言自动分词技术,又是对分词技术的有效提升和补充。

      3 文本内容去重中间件

      文本内容去重中间件能够对文本进行查重处理,同时能找出所有的重复文件。能够快速准确地判断文件集合或数据库中是否存在相同或相似内容的记录。灵玖采用高效的文章指纹算法,能够在极短的时间内与历史指纹库进行对比,从而发现重复记录。

      4 文本分类过滤中间件

      文本分类中间件能够根据文献内容进行类别的划分,可以用于分类、简历分类、邮件分类、办公文档分类、区域分类等诸多应用。

      5 文本聚类中间件

      文本聚类是基于相似性算法的自动聚类技术,自动对大量无类别的文档进行归类,把内容相近的文档归为一类,并自动为该类生成标题和主题词。适用于自动生成热点舆论专题、重大事件追踪、情报的可视化分析等诸多应用。

      6 文档关键词提取中间件

      文章关键词提取中间件能够在全面把握文章的中心思想的基础上,提取出若干个代表文章语义内容的词汇或短语,相关结果可用于精化阅读、语义查询和快速匹配等。

      7 文本摘要中间件

      自动文本摘要中间件能够实现文本内容的精简提炼,从长篇文章中自动提取关键句和关键段落,构成摘要内容,方便用户快速浏览文本内容,提高工作效率。

      8 网页正文提取中间件

      灵玖基于统计分布规律模型判定网页的特征,所适用的网页不受类型和领域的限制,不需要配置抽取规则,能够全自动地对海量互联网页信息进行高效处理。

      9 全文搜索中间件

      全文搜索中间件内核经过精心设计,具有高扩展性和高通用性。可支持文本、数字、日期、字符串等各种数据类型的高效索引,支持丰富的查询语言和查询类型,支持少数民族语言的搜索。

    提醒:联系时请说明是从志趣网看到的。

免责申明:志趣网所展示的信息由用户自行提供,其真实性、合法性、准确性由信息发布人负责。使用本网站的所有用户须接受并遵守法律法规。志趣网不提供任何保证,并不承担任何法律责任。 志趣网建议您交易小心谨慎。

关于我们 | 联系我们 | 免责声明 |@2025 bestb2b.com

©志趣网