Oryx 2 是基于Apache Spark和Apache Kafka构建的 lambda 架构的实现,但专门用于实时大规模机器学习。它是一个构建应用程序的框架,但也包括用于协同过滤、分类、回归和聚类的打包的端到端应用程序。
它由三层组成,每一层都建立在以下一层之上:
- 通用 lambda 架构层,提供批处理/速度/服务层,不特定于机器学习
- 顶级的专业化,为超参数选择等提供 ML 抽象。
- 与应用程序( ALS、随机决策森林、k-means)相同的标准 ML 算法的端到端实现
Oryx 2 是基于Apache Spark和Apache Kafka构建的 lambda 架构的实现,但专门用于实时大规模机器学习。它是一个构建应用程序的框架,但也包括用于协同过滤、分类、回归和聚类的打包的端到端应用程序。
它由三层组成,每一层都建立在以下一层之上: