当前位置:首页 >今日吃瓜 >阿里AI旗舰应用夸克发布全新“AI相机” 提升AI超级框多模态能力

阿里AI旗舰应用夸克发布全新“AI相机” 提升AI超级框多模态能力

4月27日,AI相机夸克AI超级框发布全新AI相机,阿里上新“拍照问夸克”功能。旗舰全新基于视觉理解与思考推理的应用强大模型能力,夸克AI超级框从视觉出发创新下一代搜索体验,夸克框多进一步理解和回答物理世界中的发布北京中学内幕攻略各类问题。作为阿里巴巴AI旗舰应用,提升夸克AI超级框持续快速迭代,超级提升超级智能体的模态多模态能力,打造客户生活、AI相机工作、阿里学习的旗舰全新AI超级入口。

阿里AI旗舰应用夸克发布全新“AI相机” 提升AI超级框多模态能力   

视觉交互创新,智能分析万物

在工作、夸克框多学习、发布生活各类场景中,面对复杂物体、表格和图形时,客户往往难以准确描述真实需求。全新的夸克AI相机能深入理解客户意图,更好地实现视觉搜索、多轮问答、图像处理与创作。

基于AI超级框背后的视觉理解和推理模型能力,“拍照问夸克”能在手机和电脑上进行图片搜索、问答、思考、编辑以及创作。全新的多模态产物入口和交互体验,让AI相机成为AI时代客户表达问题和获取信息的关键方式。

“拍照问夸克”能精准识别图片中的人物、物体和诸多细节,能深入理解客户需求并联想相关问题。比如,拍照搜索文物时自动关联历史背景,上传商品图片时一键跳转淘宝同款链接。无论是人物、动物、植物、建筑、风景、美食、艺术品、商品、外文资料还是故障代码,夸克都能做到秒级识别,经过多轮问答和深度思考后,给出同类产物中的最佳回答。

 深入理解意图,完成复杂任务

过去,客户需要切换多个AI工具才能完成围绕“图片”的复杂任务。现在,夸克进一步提升“超级Agent”在视觉搜索的产物体验和使用场景,满足客户对现实物理世界的解读、处理和创作。

“拍照问夸克”将搜索、扫描、修图、翻译、创作等能力聚合为统一入口。针对较为复杂的图像,客户可一次上传10张图片进行深度推理并完成各类复杂任务。目前,夸克具备超百个专业Agent和原子能力,包括搜索、健康、学习、旅游、商品、创作等,持续通过模型能力升级来优化Agent组合策略,满足客户对图像信息的个性化需求。

阿里AI旗舰应用夸克发布全新“AI相机” 提升AI超级框多模态能力   

 旅行中,“拍照问夸克”化身“专业导游”,边逛边拍获取文物讲解、景点攻略;工作中,它能辅助分析信息图表、优化代码逻辑,生成工作总结文档;在健康领域,上传体检报告,它给出指标异常分析以及康复方案建议。娱乐场景中,它支持棋牌指导、截图找剧、情头配对等趣味功能,并能一键完成高清化、去水印、原文溯源等。此外,“拍照问夸克”还支持多种语言提问和翻译解读。

 今年3月,夸克发布“AI超级框”并不断迭代客户体验。随着“拍照问夸克”上线,“AI超级框”在多模态交互上极大拓展了应用场景。AI信息分析机构Xsignal最新信息显示,客户活跃率方面,夸克排名行业第一,次日留存率同样稳居榜首。分析师认为,夸克通过升级“AI超级框”,从学习到工作、生活全场景覆盖,多模态功能融合和智能交互创新,精准直击客户需求。

 夸克搜索负责人张帆表示:“我们希望通过提升AI超级框的多模态能力,打造客户与现实物理世界之间的全新交互方式和产物体验。AI时代,夸克将继续围绕信息的获取、消费、编辑、传输、运营、决策和创作,由AI超级框承载更多的需求、更好的交互、更大的能力。”

雷峰网版权文章,未经授权禁止转载。详情见转载须知。

阿里AI旗舰应用夸克发布全新“AI相机” 提升AI超级框多模态能力

(责任编辑:速台)

    推荐文章
    • 多模态AI技术「涌现」,AI公司的「新机会」

      多模态AI技术「涌现」,AI公司的「新机会」ChatGPT-4的横空出世,让AI行业再一次柳暗花明。某AI企业人士如此评价GPT-4的进步:“GPT-3或3.5像一个六年级学生,而GPT-4像一个聪明的十年级学生。”即将毕业的小学生与新晋高中生 ...[详细]
    • 月之暗面发布首款数学模型 k0

      月之暗面发布首款数学模型 k0今天,在京东科技大厦,月之暗面创始人杨植麟宣布 Kimi 数学模型 k0-math 正式发布,其数学能力对标OpenAI o1系列,还公布了截止2024年10月 Kimi 月活超过 3600万。杨植麟 ...[详细]
    • 机器人端侧模型的十字路口

      机器人端侧模型的十字路口作者|朱可轩编辑|陈彩娴自 2023 年以来,以大模型为代表的人工智能与以具身智能为代表的机器人成为科技发展的两股重要力量。与此同时,将人工智能算法、尤其是大模型应用于进一步提升机器人智能水平也成为一 ...[详细]
    • Kimi 正在重新定义「AI 搜索」

      Kimi 正在重新定义「AI 搜索」AI搜索的故事是这么讲的:传统搜索过程需要输入关键词,然后机械地反馈回来具有相关性的数十个蓝色链接。AI搜索则不是返回链接,而是帮助总结好的内容、聚合一份「答案」。为了让这份答案看起来更加丰富,很多产 ...[详细]
    • 对话零一万物:大模型产品要找到 TC

      对话零一万物:大模型产品要找到 TC【雷峰网(公众号:雷峰网)】近日,大模型独角兽零一万物又开发布会了!上次零一万物以下简称“零一”)开发布会还是在 2023 年 11 月,宣布成立后的模型首秀:发布中英双语大模型“Yi”,并将其开源。 ...[详细]
    • 《天下第一楼》600场演来如初见

      《天下第一楼》600场演来如初见来源标题:《天下第一楼》600场演来如初见“好一座危楼谁是主人谁是客,只三间老屋时宜明月时宜风。”这副悬挂于老字号福聚德厅堂中的对联,已在舞台上陪伴观众度过37载春秋。6月2日 ...[详细]
    • 特斯拉首款无人驾驶 RobotTaxi,升级版 Optimus 还是画大饼?

      特斯拉首款无人驾驶 RobotTaxi,升级版 Optimus 还是画大饼?北京时间 10 月 11 日上午,特斯拉在洛杉矶华纳兄弟工作室召开“We, Robot”演示活动,给我们带来了两款全新的自动驾驶汽车和更多关于人形机器人的畅想。早在两个星期前,马斯克就早早高调预告,“ ...[详细]
    • 世界夫人蔡保梅戛纳演绎东方优雅

      世界夫人蔡保梅戛纳演绎东方优雅来源标题:世界夫人蔡保梅戛纳演绎东方优雅【戛纳讯】当地时间2025年5月19日,第78届戛纳国际电影节的红毯上,一位身着旗袍的东方女性吸引了全球目光——她是中国女企业家、世界夫 ...[详细]
    • 别再说国产大模型技术突破要靠 Llama 3 开源了

      别再说国产大模型技术突破要靠 Llama 3 开源了【雷峰网(公众号:雷峰网)】近日,千呼万唤之下,Meta终于发布了开源大模型Llama 3的 8B 和 70B 版本,再次震动 AI 圈。Meta 表示,Llama 3 已经在多种行业基准测试上展现了 ...[详细]
    • 权威评选!2025世界十大休闲城市花落谁家?澳涞山庄揭晓答案

      权威评选!2025世界十大休闲城市花落谁家?澳涞山庄揭晓答案来源标题:权威评选!2025世界十大休闲城市花落谁家?澳涞山庄揭晓答案5月24日,2025世界娱乐休闲产业大会首个新闻发布会在中国最美山庄澳涞山庄盛大举行。备受瞩目的世界十大休闲城市榜单正式揭晓,这也 ...[详细]
    热点阅读