Product Center
神通T-Miner文本挖掘系统
神通T-Miner文本挖掘系统融合自然语言处理、机器学习、深度学习、知识图谱等多种AI智能分析技术,为用户提供高效、强大的非结构化数据分析挖掘工具,从海量文本信息中洞察数据价值和知识模式,打造企业级非结构化数据分析和智能挖掘解决方案。
产品主要特点
· 丰富的NLP算法
Ø 提供歧义消除、词性标注、句法分析、实体识别、时间推理、指代消解、新词识别等多种自然语言处理和语义分析技术,深入洞察和挖掘文本中蕴藏的潜在知识
· 强大的文本挖掘能力
Ø 提供特征抽取、文本分类、文本聚类、话题聚类、情感分析、关键词抽取、自动摘要、关系图谱分析、信息抽取、文本相似分析等10多种20多个实用的文本深度挖掘算法,满足个性化文本分析需求
· 庞大高质量的词库
Ø 内置百万级词汇量中文词库,包括通用词库、姓氏词库、行政区划词库、政府机构词库、世界城市词库、褒贬义词库、名人词库、领导人词库、同义词库、敏感词库、领域专属词库等精选词库,支持用户自定义扩展领域词库,为面向行业的文本数据挖掘分析提供词库支撑
· 丰富的数据源支持
Ø 支持无缝对接企业各类异构数据源,支持主流关系数据库、MPP数据库、本地文件系统、远程文件共享服务等文本数据源,为用户提供开箱即用的使用体验,快速构建企业级文本大数据分析平台。
· 领先的算法性能
Ø 文本挖掘算法经过团队10多年深度优化,运算速度和准确率达到业内领先水平
Ø 中文分词速度单线程可达6M/秒,单机并行计算可达30M/秒
Ø 文本自动分类、词性识别等算法,模型准确率高于90%。