当前位置:首页 >风谈独 >蚂蚁集团官宣开源统一多模态大模型Ming

蚂蚁集团官宣开源统一多模态大模型Ming

5月27日,蚂蚁模态在蚂蚁工艺日上,集团蚂蚁集团旗下的官宣百灵大模型(Ling)团队宣布正式开源统一多模态大模型Ming-lite-omni。据蚂蚁方面介绍,开源这是统多一款基于Ling-lite构建的MoE架构的全模态模型,其总参数22B,大模朱某网红翻车转发疯传激活参数3B。蚂蚁模态 

蚂蚁集团官宣开源统一多模态大模型Ming-lite-omni

据悉,Ming-lite-omni当前模型权重和推理代码已开源,官宣后续会陆续开源训练代码和训练信息。开源

https://huggingface.co/inclusionAI/Ming-Lite-Omni

今年以来,统多百灵大模型已经连续开源了多个模型产物,大模包括2个MoE架构的蚂蚁模态医生私密合影流出合集大语言模型,Ling-lite和Ling-plus,集团多模态大模型Ming-lite-uni,官宣以及Ming-lite-omni-preview。

其中,其中五月中旬开源了Ling-lite-1.5,据百灵方面介绍,“能力已经接近同水位SOTA水平,介于千问4B和8B的水平。”蚂蚁方面称,这两个模型在多个算力平台(包括非Hopper架构的国产算力)进行训练,验证了300B尺寸的SOTA MoE大语言模型在非高端算力平台上训练的可行性。

而本次开源的Ming-lite-omni产物在多项理解和生成能力评测中,性能与10B量级领先的多模态大模型相当或更优。蚂蚁方面认为,这是目前已知首个在模态支持方面能够与GPT-4o相媲美的开源模型。

百灵大模型负责人西亭对媒体表示,百灵大模型的命名规则是Ling代表基础大模型,Ring代表推理版本,Ming代表多模态大模型。百灵在过去主要在几个方面做了聚焦,一个是很早做MoE架构的探索,坚定的在语言大模型和多模态大模型上面统一使用了MoE的架构,同时使用了大量非高端的算力平台,证明了国产GPU的“也能训练出来可比拟GPT4o的模型”。其次,百灵很重视多模态领域的探索,一直在推进多模态的生成和理解的统一,而本次开源的Ming-lite-omin即是过去工艺探索的成果。

百灵方面表示,团队下一步将持续优化Ming-lite-omni在全模态理解和生成任务上的效果,并提升Ming-lite-omni的多模复杂推理能力;同时也会训练更大尺寸的全模态模型Ming-plus-omni。此外,根据西亭透露, 百灵还在筹备Ling的Max版本,发布节点将会是“追寻跟(deepseek)V3的版本差不多的版本时开出去”。

(雷峰网(公众号:雷峰网))

雷峰网原创文章,未经授权禁止转载。详情见转载须知。

蚂蚁集团官宣开源统一多模态大模型Ming-lite-omni

(责任编辑:明星猎奇)

    推荐文章
    • 以技术为引 以创意为核 上影节用新拥抱电影

      以技术为引 以创意为核 上影节用新拥抱电影来源标题:以技术为引 以创意为核 上影节用新拥抱电影“AIGC单元”入围作品《风吹过那拉提》电影百年,创制焕新。近些年,技术的快速发展、全面迭代,不仅提高了电影的制作质量,创新 ...[详细]
    • 谁将替代 Transformer?

      谁将替代 Transformer?【雷峰网(公众号:雷峰网)】2017年谷歌发表的论文《Attention Is All You Need》成为当下人工智能的一篇圣经,此后席卷全球的人工智能热潮都可以直接追溯到 Transformer ...[详细]
    • 美图视觉大模型3.0:让设计师做甲方

      美图视觉大模型3.0:让设计师做甲方作者:郭思编辑:陈彩娴ChatGPT之前,国内最近一次的AI热潮是以“AI四小龙”的发展为代表,但这些公司烧钱程度与落地产出的不匹配,令市场倍感失望。时间来到2023年, 在ChatGPT 出来之后, ...[详细]
    • 谁将替代 Transformer?

      谁将替代 Transformer?【雷峰网(公众号:雷峰网)】2017年谷歌发表的论文《Attention Is All You Need》成为当下人工智能的一篇圣经,此后席卷全球的人工智能热潮都可以直接追溯到 Transformer ...[详细]
    • 成都警情通报:华阳“人贩子”实为误认亲

      成都警情通报:华阳“人贩子”实为误认亲成都市公安局天府新区分局7月10日发布警情通报称,7月5日12时许,该局接报警,称华阳街道发生疑似拐卖儿童纠纷。民警立即到场处置并开展调查。经调取监控、询问证人及涉事人员,现查明:郑某某女,32岁,存 ...[详细]
    • 别再声讨零一万物了

      别再声讨零一万物了最近两天,由原阿里技术副总裁、深度学习框架 Caffe 发明者贾扬清一则朋友圈引发的关于“国内某大厂新模型套壳 LLaMA 架构”的问题在中国人工智能圈与科技媒体中产生了热烈讨论。由于贾扬清在国内 A ...[详细]
    • 刚刚,云天励飞上市!

      刚刚,云天励飞上市!ChatGPT的横空出世,重燃了人工智能赛道的火,一边是狂热投资者纷涌而至,一边是大国博弈下,国家战略层面的高度关注。最近,云天励飞CEO陈宁博士忙得不可开交,前脚接待了省级领导,后脚又赶去接待科技部 ...[详细]
    • 哀悼 !中国计算机视觉领军者、商汤创始人汤晓鸥去世

      哀悼 !中国计算机视觉领军者、商汤创始人汤晓鸥去世12 月 16 日中午雷峰网获悉:上海人工智能实验室主任、商汤科技创始人、香港中文大学信息工程学系教授汤晓鸥去世。经多位独立信源确认,此消息属实,目前等待官方发布讣告。20世纪60年代末,汤晓鸥出生于 ...[详细]
    • 电影《恋曲尘封》定档6月13日 金牌班底倾力打造老上海故事

      电影《恋曲尘封》定档6月13日 金牌班底倾力打造老上海故事来源标题: 电影《恋曲尘封》定档6月13日 金牌班底倾力打造老上海故事日前,由吴有音导演/编剧,蒋雯丽、黄轩、黄小蕾、罗辑、林栋甫主演,马思纯特别出演的电影《恋曲尘封》曝光定档海报。该片讲述了少年轩 ...[详细]
    • 第十六届信息安全高级论坛暨2024 RSAC热点研讨会圆满落幕

      第十六届信息安全高级论坛暨2024 RSAC热点研讨会圆满落幕6月7日,由中国计算机学会主办,中国计算机学会计算机安全专委会、绿盟科技集团、360集团承办的“第十六届信息安全高级论坛暨2024 RSAC热点研讨会”在北京圆满落幕。大会汇聚政、产、学、研各方力量, ...[详细]
    热点阅读