MLlib是 Apache Spark 的可扩展机器学习库
MLlib适合Spark的API,并与Python(从Spark0.9开始)和R库(从Spark1.5开始)中的NumPy互操作。您可以使用任何Hadoop数据源(例如HDFS、HBase或本地文件),从而轻松插入Hadoop工作流。
Spark擅长迭代计算,使MLlib能够快速运行。同时,我们关心算法性能:MLlib包含利用迭代的高质量算法,并且可以产生比有时在MapReduce上使用的单遍近似更好的结果。
您可以使用其独立集群模式在EC2、HadoopYARN、Mesos或Kubernetes上运行Spark。访问HDFS、 ApacheCassandra、 ApacheHBase、 ApacheHive和数百个其他数据源 中的数据。
以闪电般的速度构建网络应用。
从海量数据和大规模知识中持续进化,实现从提出、规划到解决问题的全流程闭环。
亚马逊AI平台
Apache MXNet免费开源的深度...
搭建政产学研用合作平台,构建我国人工智能产业生态
网课/在线会议实时翻译工具