时间:2025-08-23 07:20 2608人阅读
10月30日,昆仑万维宣布开源百亿级大语言模型「天工」Skywork-13B系列,并罕见地配套开源了600GB、150B Tokens的超大高质量开源中文数据集。昆仑万维「天工」Skywork-13B ...[详细]
时间:2025-08-23 07:12 2446人阅读
「打造中国OpenAI」,「西湖心辰」这家创立时间不到两年的小公司怎么敢夸下海口?相比于国内的其他创业团队,心辰具有以下几大优势:1.在大模型的研究和商业化落地要早一年。积累了超过百万的用户,并训练出 ...[详细]
时间:2025-08-23 07:01 1409人阅读
历经去年持续一年之久的百模大战后,今年伊始,落地应用开始成为大模型的主流叙事方式。本以为,在月之暗面、智谱、MiniMax、百川、零一万物等一众明星企业之后,关于通用大模型的格局既定,没想到,平静水面 ...[详细]
时间:2025-08-23 06:56 417人阅读
2月1日,刚成立一年的面壁智能发布了两个在海内外大模型领域「炸裂级」的存在——面壁 MiniCPM 2B 旗舰端侧大模型与面壁OmniLMM多模态大模型。MiniCPM 2B 有着当之无愧的「小钢炮」 ...[详细]
时间:2025-08-23 06:55 2879人阅读
在“高质量完成‘十四五’规划”首场发布会上,国家发展改革委主任郑栅洁介绍了我国“十四五”时期经济社会发展成就。“十四五”期间我们站上了一个又一个“大国重器”的创新制高点“第一艘”“第一座”“第一次”海 ...[详细]
时间:2025-08-23 06:54 2381人阅读
作者:赖文昕编辑:陈彩娴自3天前Sora发布以来,由图灵奖得主、Meta首席科学家Yann LeCun提出的“世界模型”又一次引起了广泛关注。“世界模型”作为Sora的一大核心亮点,被OpenAI写在 ...[详细]
时间:2025-08-23 06:41 2846人阅读
一、“寻数计划”简介如果您有大模型所需的丰富语料数据资源,如果您有标准化的高质量精标语料数据产品,如果您愿意以多元化方式参与大模型高水平语料数据要素建设,诚邀您加入“寻数计划”。“寻数计划”是大模型语 ...[详细]
时间:2025-08-23 06:36 2764人阅读
作者丨孙溥茜编辑丨陈彩娴AI科技评论消息,今天,第四范式以“6682”为股票代码,正式在香港联合交易所挂牌上市。第四范式是从去年年底大模型浪潮兴起以来首家成功上市的国内AI公司。值得注意的是,第四范式 ...[详细]
时间:2025-08-23 06:12 2902人阅读
近日,关于字节跳动大语言模型研发技术专家杨红霞离职创业的事情,坊间传得沸沸扬扬。雷峰网独家获悉,杨红霞已于 5 月下旬正式从字节跳动离职,开始筹备 AI 创业项目。不过,杨红霞不做“大”模型,而是将方 ...[详细]
时间:2025-08-23 06:10 2709人阅读
【雷峰网(公众号:雷峰网)】近日,大模型初创公司零一万物发布了Yi 大模型 API 开放平台,为开发者提供通用 Chat、200k 超长上下文、多模态交互等模型。零一万物由创新工场董事长兼首席执行官李 ...[详细]
时间:2025-08-23 05:53 1014人阅读
6月7日,由中国计算机学会主办,中国计算机学会计算机安全专委会、绿盟科技集团、360集团承办的“第十六届信息安全高级论坛暨2024 RSAC热点研讨会”在北京圆满落幕。大会汇聚政、产、学、研各方力量, ...[详细]
时间:2025-08-23 05:48 2192人阅读
近日,上海人工智能实验室上海AI实验室)发布新一代高质量大模型预训练语料“万卷CC”WanJuan-CC),首批开源的语料覆盖过去十年互联网上的公开内容,包含1千亿字符100Btoken),约400G ...[详细]
时间:2025-08-23 05:41 1542人阅读
ChatGPT-4的横空出世,让AI行业再一次柳暗花明。某AI企业人士如此评价GPT-4的进步:“GPT-3或3.5像一个六年级学生,而GPT-4像一个聪明的十年级学生。”即将毕业的小学生与新晋高中生 ...[详细]
时间:2025-08-23 05:41 409人阅读
【雷峰网(公众号:雷峰网)】近日,千呼万唤之下,Meta终于发布了开源大模型Llama 3的 8B 和 70B 版本,再次震动 AI 圈。Meta 表示,Llama 3 已经在多种行业基准测试上展现了 ...[详细]
时间:2025-08-23 05:41 1296人阅读
近日,上海人工智能实验室上海AI实验室)发布新一代高质量大模型预训练语料“万卷CC”WanJuan-CC),首批开源的语料覆盖过去十年互联网上的公开内容,包含1千亿字符100Btoken),约400G ...[详细]
时间:2025-08-23 05:22 1233人阅读
10月30日,昆仑万维宣布开源百亿级大语言模型「天工」Skywork-13B系列,并罕见地配套开源了600GB、150B Tokens的超大高质量开源中文数据集。昆仑万维「天工」Skywork-13B ...[详细]
时间:2025-08-23 05:20 1371人阅读
编译 | 赖文昕编辑 | 陈彩娴大模型的诞生,让科技巨头与创业公司们在新一轮的竞赛中再次鸣枪出发,OpenAI、Anthropic、Mistral等创业之星的升起更是证明了在新技术的影响下,大厂并不存 ...[详细]
时间:2025-08-23 05:16 373人阅读
2024年5月7日,MediaTek 举办天玑开发者大会2024MDDC 2024),本届大会以“AI予万物”为主题,深入研讨生成式 AI 技术为移动生态带来的变革与全新机遇。会上,MediaTek ...[详细]
时间:2025-08-23 05:14 2063人阅读
编译 | 郭 思编辑丨陈彩娴在实际应用大模型的过程中,尤其是处理长文本的上下文信息时,如何高效灵活地调度计算资源成为一个学术界与工业界共同关注的问题。大语言模型所能容纳的上下文长度直接影响了诸如 Ch ...[详细]
时间:2025-08-23 05:10 2277人阅读
2月1日,刚成立一年的面壁智能发布了两个在海内外大模型领域「炸裂级」的存在——面壁 MiniCPM 2B 旗舰端侧大模型与面壁OmniLMM多模态大模型。MiniCPM 2B 有着当之无愧的「小钢炮」 ...[详细]
阿里与上交大提出 LLM 长文本计算新解法:可处理文本长达 1900k 字节、效率提升 2.4 倍
英伟达 Jim Fan:具身智能的难点不是硬件,而是「Foundation Agent」
SCOW 首次亮相 HPC China 2022,以算网融合助力“东数西算”工程发展
共襄学术盛宴,共话产业发展,2024中国图象图形大会在西安圆满落幕