Gemini原生多模态碾压ChatGPT,谷歌从一开始就建立了一个“多感官”模型,给其“投喂”多模态数据(包括文字、音频、图片、视频、PDF文件等)进行训练。多模态的意义就为人形机器人铺路更贴近AGI。