字节跳动智能创作团队近日宣布,他们联合北京交通大学、北京科技大学的研究人员提出了首个无需依赖 SAM 的高效像素级推理大模型 PixelLM。 研究团队表示,PixelLM 能够熟练处理任意数量的开放域目标和多样化的复杂推理分割任务,同时避免了额外的、成本高昂的分割模型,提升了效率和对不同应用的迁移能力。在三个 benchmark 的绝大多数指标上,PixelLM 的性能均优于其他方法,且由于 PixelLM 不依赖于 SAM,其 TFLOPs 远远低于同尺寸的模型。
© 版权声明
本文转载自互联网、仅供学习交流,内容版权归原作者所有,如涉作品、版权或其它疑问请点击联系删除。