7月5日,蚂蚁集团在2024年世界人工智能大会“可信大模型助力产业创新发展”论坛上公布了自主研发的百灵大模型最新研发进展:百灵大模型可以“看”“听”、能“说”能“画”的原始多模态能力,能直接理解和训练音频、视频、图片、文本等多模态数据。本地多模态被认为是通往agi的唯一途径。在中国,只有少数大型模型制造商实现了这一能力。记者从会议现场的演示中看到,多模态技术可以让大模式更像人类一样感知和互动,支持智能体验升级。百灵的多模态能力已经应用于“支付宝智能助手”,未来将支持支付宝上更多的智能体升级。
1. (蚂蚁集团副总裁徐鹏介绍了百灵大模型的原始多模态能力)蚂蚁集团副总裁徐鹏在发布现场展示了更多新升级的多模态技术可以实现的应用场景:
蚂蚁集团以百灵大模型多模态能力为基础,探索了大规模应用落地产业的实践。
论坛上同时发布的“支付宝多模态医疗大模型”就是这一探索的实践。据了解,支付宝多模态医疗模式增加了100亿中英文图文、1000亿医疗文本语料、1000万高质量医疗知识图谱,包括报告、图像、药品等多模态信息。它具有专业的医学知识。在中国医疗LLM评估列表的promptCBLUE中,它获得了A列表第一和B列表第二。
基于百灵大模型多模态能力,蚂蚁集团与武汉大学联合开发的遥感模型SkySense也在论坛上公布了开源计划。SkySense是目前参数最大、覆盖任务最全、识别精度最高的多模态遥感基础模型。
“从单一的文本语义理解到多模态能力是人工智能技术的关键迭代,多模态技术产生的“听、说、写”应用场景将使人工智能的性能更加真实,更接近人类,从而更好地为人类服务。蚂蚁将继续投资于本地多触摸技术的研发。”徐鹏说。
以上是蚂蚁百灵大模型的最新进展:具有原生多模态能力的详细内容,请关注其他相关文章!
数据守护神:一键备份,安心恢复
蚂蚁百灵大模型的最新进展:已经具备了原生的多模态能力-人工智能
顶尖数据守护神,一键备份无忧之选!
高效入门:手把手教你搭建服务器,实战教学
目的端口远程连接:高效、安全,一键直达!
加速器服务器地址,高效连接必备密钥!
CAD复制粘贴卡顿?一键优化,流畅操作!
b站怎么看直播人数-常见问题
如何将mp3转移到b站缓存的m4s-常见问题
如果Win11手柄连接成功,该怎么办?常见问题
如何修改QQ实名认证-常见问题
延迟写入失败怎么办?常见问题
Win10如何关闭笔记本电脑的启动声-常见问题
Win11计算机如何查看显卡驱动版本-常见问题
1mb等于多少kb-常见问题
Win11推荐2024年最佳流畅性能-常见问题
Wallpaper如何下载到本地-常见问题
Wallpaper如何向朋友隐藏自己的订阅-常见问题