登陆注册

华中科大发布多模态大模型

  • 华中科大发布多模态大模型“Monkey”,团队称“看图说话”能力突出

    Monkey模型在医学影像、卫星图像等领域具有广泛的应用空间。近日,华中科技大学软件学院白翔教授领衔的VLRLab团队发布并开源了一个高性能多模态大模型“Monkey”。该模型通过提高输入分辨率和引入多级描述生成方法,解决了现有模型在复杂场景和视觉细节处理方面的挑战。多模态大模型是一类可以同时处理和整合多种感知数据(例如文本、图像、音频等)的AI架构,近年来在众多场景中展现了卓越的能力。
    锤子财富2023-12-11 16:58:49
    0001