当前位置:首页 >风集深
推荐文章
  • 上海AI实验室开源发布高质量语料“万卷CC”

    上海AI实验室开源发布高质量语料“万卷CC”近日,上海人工智能实验室上海AI实验室)发布新一代高质量大模型预训练语料“万卷CC”WanJuan-CC),首批开源的语料覆盖过去十年互联网上的公开内容,包含1千亿字符100Btoken),约400G ...[详细]
  • 被低估的面壁:打造出不输 OpenAI 的 Scaling Law 曲线

    被低估的面壁:打造出不输 OpenAI 的 Scaling Law 曲线大约 1 个月前,马斯克所创办的 xAI 团队宣布开源 Grok-1——一个参数量为 3140 亿的 MoE 大模型。从参数量来看,Grok-1 超越了 70B 的 LLaMA 2,是当前开源模型中最 ...[详细]
  • 阿里云 all in AI 的决心

    阿里云 all in AI 的决心如何抓住 AI 的机会?这是进入大模型时代后,面对新的起点,各大云厂商在不断思考的问题。毋庸置疑,AI 与云已经成为紧密的拍档。大模型的迭代进化离不开云计算的支撑,而大模型的落地应用,给云计算勾勒了一 ...[详细]
  • 刚刚,云天励飞上市!

    刚刚,云天励飞上市!ChatGPT的横空出世,重燃了人工智能赛道的火,一边是狂热投资者纷涌而至,一边是大国博弈下,国家战略层面的高度关注。最近,云天励飞CEO陈宁博士忙得不可开交,前脚接待了省级领导,后脚又赶去接待科技部 ...[详细]
  • 中国正大步迈向全球创新中心

    中国正大步迈向全球创新中心2024年全社会研发经费投入规模增加到3.6万亿元,位居全球第二。从标杆看,深圳研发投入占GDP的比重达6.46%。中国正从全球制造中心大步迈向全球创新中心。 ...[详细]
  • 别再声讨零一万物了

    别再声讨零一万物了最近两天,由原阿里技术副总裁、深度学习框架 Caffe 发明者贾扬清一则朋友圈引发的关于“国内某大厂新模型套壳 LLaMA 架构”的问题在中国人工智能圈与科技媒体中产生了热烈讨论。由于贾扬清在国内 A ...[详细]
  • 当「养老」遇上 AI 大模型

    当「养老」遇上 AI 大模型作者:赖文昕编辑:陈彩娴鲜少有人关注到这样一个现象:在大模型的发展初期,「研发」与「产品」往往来自同一个群体——程序员。由于大模型技术的系统复杂,新一代大模型产品经理的数量稀少,程序员往往既是技术、又 ...[详细]
  • 对话中科深智成维忠:数字人的关键是交互,交互的关键是大模型

    对话中科深智成维忠:数字人的关键是交互,交互的关键是大模型作者丨王悦编辑丨董子博“今年的数字人市场迎来了天翻地覆的变化。”中科深智创始人成维忠对目前国内的数字人市场如是评价。过去,国内数字人企业真正做技术的并不多,大部分以IP打造为主。出道即巅峰的虚拟美妆达 ...[详细]
  • AI推理芯片,大模型「下半场」的入场券

    AI推理芯片,大模型「下半场」的入场券2023是“群模共舞”的元年。先是ChatGPT的横空出世给予众人致命震撼,随后国内诸多AI、互联网公司迅速加大资源投入“练模”。3月,百度发布文心一言,打响了“练模大战”的第一枪。在这场“模型大战” ...[详细]
  • 阿里与上交大提出 LLM 长文本计算新解法:可处理文本长达 1900k 字节、效率提升 2.4 倍

    阿里与上交大提出 LLM 长文本计算新解法:可处理文本长达 1900k 字节、效率提升 2.4 倍编译 | 郭 思编辑丨陈彩娴在实际应用大模型的过程中,尤其是处理长文本的上下文信息时,如何高效灵活地调度计算资源成为一个学术界与工业界共同关注的问题。大语言模型所能容纳的上下文长度直接影响了诸如 Ch ...[详细]