医疗类 app 开发 ¥11000 微信二次开发 ¥3500 抽奖活动前端开发 ¥7000 官网 UI 设计 ¥4000 搜索匹配方案 ¥25000 艺术品交易网站开发 ¥80000
本列表总结了 25 个 Java 机器学习工具 & 库:
1. Weka 集成了数据挖掘工作的机器学习算法。这些算法可以直接应用于一个数据集上或者你可以自己编写代码来调用。Weka 包括一系列的工具,如数据预处理、分类、回归、聚类、关联规则以及可视化。
2. Massive Online Analysis (MOA)是一个面向数据流挖掘的流行开源框架,有着非常活跃的成长社区。它包括一系列的机器学习算法(分类、回归、聚类、异常检测、概念漂移检测和推荐系统)和评估工具。关联了 WEKA 项目,MOA 也是用 Java 编写的,其扩展性更强。
3. MEKA 项目提供了一个面向多标签学习和评价方法的开源实现。在多标签分类中,我们要预测每个输入实例的多个输出变量。这与 "普通" 情况下只涉及一个单一目标变量的情形不同。此外,MEKA 基于 WEKA 的机器学习工具包。
4. Advanced Data mining And Machine learning System (ADAMS)是一种新型的柔性工作流引擎,旨在迅速建立并保持真实世界的复杂知识流,它是基于 GPLv3 发行的。
5. Environment for Developing KDD-Applications Supported by Index-Structure (ELKI)是一款基于 Java 的开源(AGPLv3)数据挖掘软件。ELKI 主要集中于算法研究,重点研究聚类分析中的无监督方法和异常检测。
6. Mallet 是一个基于 Java 的面向文本文件的机器学习工具包。Mallet 支持分类算法,如最大熵、朴素贝叶斯和决策树分类。
7. Encog 是一个先进的机器学习框架,集成了支持向量机(SVM)、人工神经网络、遗传算法、贝叶斯网络、隐马尔可夫模型(HMM)、遗传编程和遗传算法。
8. Datumbox 机器学习框架是一个用 Java 编写的开源框架,允许快速地开发机器学习和统计应用。该框架的核心重点包括大量的机器学习算法以及统计测试,能够处理中等规模的数据集。
9. Deeplearning4j 是使用 Java 和 Scala 编写的第一个商业级的、开源的、分布式深入学习库。其设计的目的是用于商业环境中,而不是作为一个研究工具。
10. Mahout 是一个内置算法的机器学习框架。Mahout-Samsara 帮助人们创建他们自己的数学,并提供了一些现成的算法实现。
11. Rapid Miner 是德国多特蒙特技术大学开发的。它为开发者开发应用程序提供了一个 GUI(图形用户界面)和 Java API。它还提供了一些机器学习算法,用来做数据处理、可视化以及建模。
12. Apache SAMOA 是一个机器学习(ML)框架,内嵌面向分布式流 ML 算法的编程抽象,并且允许在没有直接处理底层分布式流处理引擎(DSPEe,如 Apache Storm、Apache S4 和 Apache samza)复杂性的情况下,开发新的 ML 算法。用户可以开发分布式流 ML 算法,而且可以在多个 DSPEs 上执行。
13. Neuroph 通过提供支持创建、训练和保存神经网络的 Java 网络库和 GUI 工具,简化了神经网络开发。
14. Oryx 2 是一个建立在 Apache Spark 和 Apache Kafka 的 Lambda 架构实现,但随着实时大规模机器学习而逐渐开始专业化。这是一个用于构建应用程序的框架,但也包括打包,以及面向协同过滤、分类、回归和聚类的端到端的应用程序。
15. Stanford Classifier 是一个机器学习工具,它可以将数据项归置到一个类别。一个概率分类器,比如这个,它可以对一个数据项给出类分配的概率分布。该软件是最大熵分类器的一个 Java 实现。
16. io 是一个 Retina API,有着快速精确的类似大脑的自然语言处理算法。
17. JSAT 是一个快速入门的机器学习库。该库是我在业余时间开发的,基于 GPL3 发行的。库中的一部分内容可自主学习,例如所有的代码都是独立的。JSAT 没有外部依赖,而且是纯 Java 编写的。
18. N-Dimensional Arrays for Java (ND4J) 是一个用于 JVM 的科学计算库。它们是用来在生产环境中使用的,这表明例程的设计是以最小的内存需求来运行的。
19. Java Machine Learning Library (Java 机器学习库)是一系列机器学习算法的相关实现。这些算法,无论是源代码还是文档,都编写的很出色。其主要语言是 Java。
20. Java-ML 是一个使用 Java 编写的一系列机器学习算法的 Java API。它只提供了一个标准的算法接口。
21. MLlib (Spark) 是 Apache Spark 的可扩展机器学习库。虽然是 Java,但该库与平台还支持 Java,Scala 和 Python 绑定。此库是最新的,并且算法很多。
22. H2O 是用于智能应用的机器学习 API。它在大数据上对统计学、机器学习和数学进行了规模化。H2O 可扩展,开发者可以在核心部分使用简单的数学知识。
23. WalnutiQ 是人脑部分面向对象模型,有着理论常用的学习算法(正在向简单强烈的情感人工智能模型方向研究)。
24. RankLib 是一个排名学习算法库。目前已经实现八种流行的算法。
25. htm.java (基于 Java 的 Hierarchical Temporal Memory 算法实现)是一个面向智能计算的 Numenta 平台的 Java 接口。 源码
来源: http://www.codeceo.com/article/25-java-machine-learning-tools.html