典型的数据挖掘系统的主要成分

典型的数据挖掘系统的主要成分

2019-01-10 | 作者 : jiping

category : 数据爬取

典型的数据挖掘系统具有以下主要成分:

  • 数据库、数据仓库、或其它信息库:这是一个或一组数据库、数据仓库、展开的表、或其它类 型的信息库。可以在数据上进行数据清理和集成。
  • 数据库或数据仓库服务器:根据用户的数据挖掘请求,数据库或数据仓库服务器负责提取相关 数据。
  • 知识库:这是领域知识,用于指导搜索,或评估结果模式的兴趣度。这种知识可能包括概念分 层,用于将属性或属性值组织成不同的抽象层。用户确信方面的知识也可以包含在内。可以使 用这种知识,根据非期望性评估模式的兴趣度。领域知识的其它例子有兴趣度限制或阈值和元 数据(例如,描述来自多个异种数据源的数据)。
  • 数据挖掘引擎:这是数据挖掘系统基本的部分,由一组功能模块组成,用于特征、关联、分类、聚类分析、演变和偏差分析。
  • 模式评估模块:通常,该部分使用兴趣度度量,并与挖掘模块交互,以便将搜索聚 焦在有趣的模式上。它可能使用兴趣度阈值过滤发现的模式。模式评估模块也可以与挖掘模块 集成在一起,这依赖于所用的数据挖掘方法的实现。对于有效的数据挖掘,建议尽可能地将模 式评估推进到挖掘过程之中,以便将搜索限制在有兴趣的模式上。
  • 图形用户界面:该模块在用户和挖掘系统之间通讯,允许用户与系统交互,指定数据挖掘查询 或任务,提供信息、帮助搜索聚焦,根据数据挖掘的中间结果进行探索式数据挖掘。此外,该 成分还允许用户浏览数据库和数据仓库模式或数据结构,评估挖掘的模式,以不同的形式对模 式可视化。
label :
评论至少50个字符| 支持MarkDown语法 登陆后可以评论!
评论

 



最多关注
近期文章