致力于中文信息智能化处理研究

文本自动分类_svm_svm.net_文本分词_文本聚类

快速链接
相关链接
  • 文本自动分类
  • 文本聚类
汉语言智能实验室,专注文本挖掘,数据挖掘
随着计算机信息技术和网络技术的发展,使今天的Web成为信息发布、交互和 获取的主要工具。万维网是一个巨大、分布广泛、全球性的信息服务中心,它涉及新 闻、广告、消费信息、金融管理、教育、政府、电子商务和许多其它信息服务,然而, 互联网的快速发展却给我们带来了信息爆炸的问题,丰富的Web资源中蕴含了大量 具有巨大的潜在价值的知识或者模式,人们迫切需要能够从Web上快速、有效地发 现知识和模式的工具。此时数据挖掘技术为解决这个问题提供了一种解决方案,而这 些海量的数据源恰恰为数据挖掘提供了基本的支持。但是Web上的信息都是异质的, 半结构化的,Web页面的复杂性高于任何传统的文本文档,它缺乏统一的结构,风格 各异,而且这些海量文档也没有索引化,查找起来相当困难。面对各种困难,传统的数据挖掘技术显然难以胜任,汉语言智能实验室致力于中文信息智能化处理研究 , 以自主研发的中文信息处理技术为基础,推出了一系列中文信息处理解决方案.
快速通道-文本挖掘
专业信息智能化处理实验实