Gemma 4 如何在巴掌大的设备上“看”和“说”?本地多模态Agent的实操演示 一个在 NVIDIA Jetson Orin Nano Super 上运行的端到端多模态Agent演示,展示了模型如何自主决定是否调用摄像头,并结合视觉信息回答问题,标志着强大AI能力向边缘设备下沉。 Hugging Face Blog · 2026年4月22日