MLlib是 Apache Spark 的可扩展机器学习库
MLlib适合Spark的API,并与Python(从Spark0.9开始)和R库(从Spark1.5开始)中的NumPy互操作。您可以使用任何Hadoop数据源(例如HDFS、HBase或本地文件),从而轻松插入Hadoop工作流。
Spark擅长迭代计算,使MLlib能够快速运行。同时,我们关心算法性能:MLlib包含利用迭代的高质量算法,并且可以产生比有时在MapReduce上使用的单遍近似更好的结果。
您可以使用其独立集群模式在EC2、HadoopYARN、Mesos或Kubernetes上运行Spark。访问HDFS、 ApacheCassandra、 ApacheHBase、 ApacheHive和数百个其他数据源 中的数据。
隆重推出 Glow AI,您的个性...
FutureTools 收集并整理了所有最好的 AI 工具,让你也能成为超人!
LongShot是一个人工智能写作...
最简单的动画方式,人工智能...
使您能够将任何科学论文输入 ...
Stability AI推出的文本到图...