让我向您解释一下这些术语:
云计算:这是一个非常有趣的商业概念。其实说白了就是将处理任务转移给监控服务器,但是服务器处理资源是可以分包的。当然,大规模商用还存在一些问题,尤其是隐私保护方面的问题。
大数据:说白了就是数据太多了。即使今天的数兆字节数据在20年前也是大数据。但今天的大数据有什么特别之处呢?今天的问题是数据太多了,已经超出了传统计算机的处理能力(与量子计算机的区别),所以对于大数据我们不得不使用一些折衷的方法(比如数据挖掘),这意味着没有所有的数据都需要精准的管理,事实上,实际的数据是非常有限的,利用数据挖掘的方法来提取这有限的知识就足够了。·此外,数据采样和数据压缩也是解决大数据问题的一些策略。
数据挖掘:从数据中提取能够描述或预测数据特征的潜在知识。代表性的数据挖掘任务括关联规则分析、数据分类、数据聚类等。您可以在任何数据挖掘教科书中找到有关这些的信息。先说一下与大数据的区别:数据挖掘只是处理大数据的一种方法。马云提到的大数据,或者说今天商业领域提到的大数据,实际上指的是数据挖掘,实际上就是所谓的大数据,或者是《科学》杂志上提到的大数据,或者是提出的大数据发展战略由奥巴马。据我了解,这些远远超出了数据挖掘的范围,当然数据挖掘是一个非常重要的方法。真正的目标是如何有效地管理大数据。
机器学习:这个术语非常模糊,指的是一大类计算机算法。关键点是单词学习如果想让计算机有效地学习,当前大多数方法都使用迭代方法。因此,在科研界,只要采用这种不断迭代、逼近的策略,一般都可以归入机器学习的范畴。再者,所谓学习必须知道要学什么。这就是所谓的训练集。计算机必须从训练集数据中学习某种一般规则,然后使用一些其他数据(即测试集)。看看他能不能学好。好了,那么就可以用于实际应用了。因此,选择合适的训练集也是一个知识问题。
Patternrecognize:即模式识别。模型有很多种类型,它们可以是语言,可以是图像,可以是事物的一些有意义的模块,所有这些都很重要。所以总的来说,我认为模式识别这个术语有点模糊,但是具体的人脸图像识别、语音识别等。它们是非常真实的。可能是我理解不太好。
请告诉我您的其他问题。
传统的分析方法不包括数据挖掘。我对数据分析了解不多,但可以肯定的是,传统分析是有一定的分析方向的。例如,如果我想知道这两个产品之间的关系,那么我可以简单地查数据库。尽管数据挖掘有一定的历史,但它也相当流行。它会自动向您显示高度相关的产品。在此期间,用户无需指定具体的数据分析对象。
想要应对大数据时代,数据挖掘课程是必不可少的。另外,最好多了解一下数据库,尤其是并行数据库和分布式数据库。至于机器学习和模式识别,除了少数特殊领域外,一般与数据挖掘关系不大。
总之,这个概念相当热门,但大数据无论是在研究方面还是在商业化方面都还非常不成熟。我目前正在研究大数据背景下的算法。说实话,目前还没有非常可扩展的算法,所以我对大数据未来的发展方向相当困惑。
PS:数据挖掘应用到业务中,最重要的是如何确定挖掘角度。这需要对具体应用领域的良好了解和非常敏锐的眼光。至于具体的数据挖掘算法,就交给我们专门研究的吧!(了解算法也很重要,可以将算法扩展到你的范围)
上一篇:人工智能和云计算的区别
下一篇:go和云计算的关系