快速链接
- 文本自动分类
- 文本聚类
相关链接
- 文本自动分类
- 文本聚类
随着计算机信息技术和网络技术的发展,使今天的Web成为信息发布、交互和
获取的主要工具。万维网是一个巨大、分布广泛、全球性的信息服务中心,它涉及新
闻、广告、消费信息、金融管理、教育、政府、电子商务和许多其它信息服务,然而,
互联网的快速发展却给我们带来了信息爆炸的问题,丰富的Web资源中蕴含了大量
具有巨大的潜在价值的知识或者模式,人们迫切需要能够从Web上快速、有效地发
现知识和模式的工具。此时数据挖掘技术为解决这个问题提供了一种解决方案,而这
些海量的数据源恰恰为数据挖掘提供了基本的支持。但是Web上的信息都是异质的,
半结构化的,Web页面的复杂性高于任何传统的文本文档,它缺乏统一的结构,风格
各异,而且这些海量文档也没有索引化,查找起来相当困难。面对各种困难,传统的数据挖掘技术显然难以胜任,汉语言智能实验室致力于中文信息智能化处理研究
, 以自主研发的中文信息处理技术为基础,推出了一系列中文信息处理解决方案.
