当前位置:首页 > 数据中心 > 正文

数据中心专用工具


一、八个最佳的数据中心开源挖掘工具?

数据挖掘,又称数据挖掘、数据挖掘。它是数据库知识发现的一个步骤(英文:Knowledge-DiscoveryinDatabases,简称KDD。它是提取和分析大量数据并从中提取信息的过程)。其中一些应用包括市场细分——例如识别从特定品牌购买特定产品的客户的特征、欺诈检测——识别可能导致在线欺诈的交易模式等。在本文中,天通源计算机培训整理了8款最好的开源数据挖掘工具。


1


WEKA作为一个开放的数据挖掘平台,集成了大量的机器学习算法,可以承担数据挖掘任务,包括数据的预处理、分类、回归和聚类等。、关联规则和新交互界面中的可视化。


2RapidMiner


RapidMiner是全球领先的数据挖掘解决方案,数据量非常大。它涵盖了广泛的数据挖掘任务,包括各种数据艺术,并且可以简化数据挖掘过程的设计和评估。


3Orange


Orange是一个基于数据挖掘和机器学习的组件。一个既用户友好又功能强大的软件包,是一个快速且多功能的可视化编程前端,用于数据分析和可视化,并与Python结合进行脚本开发。它包含一套完整的数据预处理组件,并提供核算、转换、建模、模型评估和数据探索功能。它是用C++和Python开发的,其图形库是由跨平台的Qt框架开发的。


4Knime


KNIME(KonstanzInformationMiner)是智能的用户友好型。,并拥有开源数据集成平台、数据处理、数据分析和风眼数据研究平台。


5jHepWork


jHepWork是一套完整的面向科学的数据对象。分析框架。Jython宏用于显示一维和二维直方图数据。该程序包括许多与二维和三维科学图形交互的工具。


6ApacheMahout


ApacheMahout是Apache软件基金会开发的全新系统。(ASF)开源项目,其主要目标是创建一些可扩展的机器学习算法,供开发人员在Apache许可下免费使用。该项目正处于开发的第二年,目前只有一个公开版本。Mahout包含许多实现,包括聚类、分类、CP和进化程序。此外,可以使用ApacheHadoop库将Mahout有效地扩展到云。


7主要使用ELKI


ELKI(EnvironmentforDevelopingKDD-ApplicationsSupportedbyIndex-Structures)。聚类并查找异常值。ELKI是一个用java编写的类似weka的数据挖掘平台,具有图形GUI界面。它可用于查找异常值。