复旦团队研发的大模型
复旦团队研发AI大模型,助力视障者“看见”世界
借助人工智能的力量,将世界各地需要视力支持的人们与专业的公司紧密链接起来。
眸思(MouSi)多模态大模型是由复旦大学语言与视觉团队联合提出基于多视觉专家混合架构的视觉-语言大模型。基于新架构的眸思将擅长图文匹配、光学字符识别(OCR)和图像分割等多种经典视觉任务的专家巧妙地融为一体,显著地提高了多模态大模型在多模态对话中传统视觉任务上的表现效果。