AI开发平台AI开发框架

MLlib(ApacheSpark)

MLlib是 Apache Spark 的可扩展机器学习库

标签:
广告也精彩

使用方便

可用于Java、Scala、Python和R。

MLlib适合Spark的API,并与Python(从Spark0.9开始)和R库(从Spark1.5开始)中的NumPy互操作。您可以使用任何Hadoop数据源(例如HDFS、HBase或本地文件),从而轻松插入Hadoop工作流。

表现

高质量算法,比MapReduce快100倍。

Spark擅长迭代计算,使MLlib能够快速运行。同时,我们关心算法性能:MLlib包含利用迭代的高质量算法,并且可以产生比有时在MapReduce上使用的单遍近似更好的结果。

无处不在

Spark在Hadoop、ApacheMesos、Kubernetes上独立运行,或在云中针对不同的数据源运行。

您可以使用其独立集群模式EC2HadoopYARNMesosKubernetes上运行Spark。访问HDFS、 ApacheCassandra、 ApacheHBase、 ApacheHive和数百个其他数据源 中的数据。

    相关导航